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Prefacio: Computacao 
Cientifica 


Da Computação Científica e sua definição pragmática. 
Do porquê esta se diferencia, em metas e ferramentas, 
da Ciência da Computação. 


OMPUTAÇÃO científica não é uma área do conhecimento muito 

bem definida. A definição utilizada neste livro é a de uma área 

de atividade /conhecimento que envolve a utilização de ferramentas 

computacionais (software) para a solução de problemas científicos 

em áreas da ciência não necessariamente ligadas à disciplina da 

ciência da computação, ou seja, a computação para o restante da 
comunidade científica. 

Nos últimos tempos, a computação em suas várias facetas, tem 
se tornado uma ferramenta universal para quase todos os segmentos 
da atividade humana. Em decorrência, podemos encontrar produ- 
tos computacionais desenvolvidos para uma enorme variedade de 
aplicações, sejam elas científicas ou não. No entanto, a diversidade 
de aplicações científicas da computação é quase tão vasta quanto 
o próprio conhecimento humano. Por isso, o cientista frequente- 
mente se encontra com problemas para os quais as ferramentas 
computacionais adequadas não existem. 

No desenvolvimento de softwares científicos, temos dois modos 
principais de produção de software: o desenvolvimento de softwares 
comerciais, feito por empresas de software que contratam progra- 
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madores profissionais para o desenvolvimento de produtos voltados 
para uma determinada aplicação científica, e o desenvolvimento 
feito por cientistas (físicos, matemáticos, biólogos, etc., que não 
são programadores profissionais), geralmente de forma colabora- 
tiva através do compartilhamento de códigos fonte. 

Algumas disciplinas científicas, como a estatística por exemplo, 
representam um grande mercado para o desenvolvimento de softwa- 
res comerciais genéricos voltados para as suas principais aplicações, 
enquanto que outras disciplinas científicas carecem de massa crítica 
(em termos de número de profissionais) para estimular o desenvol- 
vimento de softwares comerciais para a solução dos seus problemas 
computacionais específicos. Como agravante, o desenvolvimento 
lento e centralizado de softwares comerciais, tem se mostrado inca- 
paz de acompanhar a demanda da comunidade científica, que pre- 
cisa ter acesso a métodos que evoluem a passo rápido. Além disso, 
estão se multiplicando as disciplinas científicas que têm como sua 
ferramenta principal de trabalho os métodos computacionais, como 
por exemplo a bio-informática, a modelagem de sistemas comple- 
xos, dinâmica molecular e etc. 

Cientistas que se vêem na situação de terem de desenvolver 
softwares para poder viabilizar seus projetos de pesquisa, geral- 
mente têm de buscar uma formação improvisada em programação 
e produzem programas que tem como característica básica serem 
minimalistas, ou seja, os programas contêm o mínimo número de 
linhas de código possível para resolver o problema em questão. Isto 
se deve à conjugação de dois fatos: 1) O cientista raramente possui 
habilidades como programador para construir programas mais so- 
fisticados e 2) Frequentemente o cientista dispõe de pouco tempo 
entre suas tarefas científicas para dedicar-se à programação. 

Para complicar ainda mais a vida do cientista-programador, as 
linguagens de programação tradicionais foram projetadas e desen- 
volvidas por programadores para programadores e voltadas ao de- 
senvolvimento de softwares profissionais com dezenas de milhares 
de linhas de código. Devido a isso, o número de linhas de código 
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mínimo para escrever um programa, científico nestas linguagens é 
muitas vezes maior do que o número de linhas de código associado 
com a resolução do problema em questão. 

Quando este problema foi percebido pelas empresas de soft- 
ware científico, surgiu uma nova classe de software, voltado para a 
demanda de cientistas que precisavam implementar métodos com- 
putacionais específicos e que não podiam esperar por soluções co- 
merciais. 

Esta nova classe de aplicativos científicos, geralmente inclui uma 
linguagem de programação de alto nível, por meio da qual os ci- 
entistas podem implementar seus próprios algoritmos, sem ter que 
perder tempo tentando explicar a um programador profissional o 
que, exatamente, ele deseja. Exemplos destes produtos incluem 
MATLAB™, MathematicalM, Maple™, entre outros. Nestes 
aplicativos, os programas são escritos e executados dentro do pró- 
prio aplicativo, não podendo ser executados fora dos mesmos. Estes 
ambientes, entretanto, não possuem várias características impor- 
tantes das linguagens de programação: Não são portáteis, ou seja, 
não podem ser levados de uma máquina para a outra e executa- 
dos a menos que a máquina-destino possua o aplicativo gerador do 
programa (MATLAB™, etc.) que custa milhares de dólares por 
licença, Os programas não podem ser portados para outra plata- 
forma computacional para a qual não exista uma versão do aplica- 
tivo gerador. E, por último e não menos importante, o programa 
produzido pelo cientista não lhe pertence, pois, para ser executado, 
necessita de código proprietário do ambiente de desenvolvimento 
comercial. 

Este livro se propõe a apresentar uma alternativa livre (base- 
ada em Software Livre), que combina a facilidade de aprendizado e 
rapidez de desenvolvimento, características dos ambientes de desen- 
volvimento comerciais apresentados acima, com toda a flexibilidade 
das linguagens de programação tradicionais. Programas científicos 
desenvolvidos inteiramente com ferramentas de código aberto tem 
a vantagem adicional de serem plenamente escrutináveis pelo sis- 


xx PREFÁCIO: COMPUTAÇÃO CIENTÍFICA 


tema de revisão por pares (“peer review”, mecanismo central da 
ciência para validação de resultados. 

A linguagem Python apresenta as mesmas soluções propostas 
pelos ambientes de programação científica, mantendo as vantagens 
de ser uma linguagem de programação completa e de alto nível. 


Apresentando o Python 


O Python é uma linguagem de programação dinâmica e orientada 
a objetos, que pode ser utilizada no desenvolvimento de qualquer 
tipo de aplicação, científica ou não. O Python oferece suporte à 
integração com outras linguagens e ferramentas, e é distribuido com 
uma vasta biblioteca padrão. Além disso, a linguagem possui uma 
sintaxe simples e clara, podendo ser aprendida em poucos dias. 
O uso do Python é frequentemente associado com grandes ganhos 
de produtividade e ainda, com a produção de programas de alta 
qualidade e de fácil manutenção. 

A linguagem de programação Python! começou a ser desen- 
volvida ao final dos anos 80, na Holanda, por Guido van Rossum. 
Guido foi o principal autor da linguagem e continua até hoje desem- 
penhando um papel central no direcionamento da evolução. Guido 
é reconhecido pela comunidade de usuários do Python como “Bene- 
volent Dictator For Life” (BDFL), ou ditador benevolente vitalício 
da linguagem. 

A primeira versão pública da linguagem (0.9.0) foi disponibi- 
lizada. Guido continou avançando o desenvolvimento da lingua- 
gem, que alcançou a versão 1.0 em 1994. Em 1995, Guido emigrou 
para os EUA levando a responsabilidade pelo desenvolvimento do 
Python, já na versão 1.2, consigo. Durante o período em que Guido 
trabalhou para o CNRI’, o Python atingiu a versão 1.6, que foi rápi- 
damente seguida pela versão 2.0. A partir desta versão, o Python 





lyww.python.org 
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passa a ser distribuído sob a Python License, compatível com a 
GPL’, tornando-se oficialmente software livre. A linguagem passa 
a pertencer oficialmente à Python Software Foundation. Apesar da 
implementação original do Python ser desenvolvida na Linguagem 
C (CPython), Logo surgiram outras implementações da Lingua- 
gem, inicialmente em Java (Jython*), e depois na própria lingua- 
gem Python (PYPY°), e na plataforma .NET (IronPython®). 

Dentre as várias características da linguagem que a tornam in- 
teressante para computação científica, destacam-se: 


Multiplataforma: O Python pode ser instalado em qualquer pla- 
taforma computacional: Desde PDAs até supercomputadores 
com processamento paralelo, passando por todas as platafor- 
mas de computação pessoal. 


Portabilidade: Aplicativos desenvolvidos em Python podem ser 
facilmente distribuídos para várias plataformas diferentes da- 
quela em que foi desenvolvido, mesmo que estas não possuam 
o Python instalado. 


Software Livre: O Python é software livre, não impondo qual- 
quer limitação à distribuição gratuita ou venda de progra- 
mas. 


Extensibilidade: O Python pode ser extendido através de mó- 
dulos,escritos em Python ou rotinas escritas em outras lin- 
guagens, tais como C ou Fortran (Mais sobre isso no capítulo 
5). 


Orientação a objeto: Tudo em Python é um objeto: funções, 
variáveis de todos os tipos e até módulos (programas escritos 
em Python) são objetos. 





3GNU General Public License 
uwv. jython.org 


“pypy org 
® www.codeplex.com/Wiki/View.aspx?Project Name=IronPython 
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Tipagem automática: O tipo de uma variável (string, inteiro, 
float, etc.) é determinado durante a execução do código; 
desta forma, você não necessita perder tempo definindo tipos 
de variáveis no seu programa. 


Tipagem forte: Variáveis de um determinado tipo não podem 
ser tratadas como sendo de outro tipo. Assim, você não pode 
somar a string '123' com o inteiro 3. Isto reduz a chance de 
erros em seu programa. A variáveis podem, ainda assim, ser 
convertidas para outros tipos. 


Cédigo legivel: O Python, por utilizar uma sintaxe simplificada 
e forçar a divisão de blocos de código por meio de indenta- 
ção, torna-se bastante legível, mesmo para pessoas que não 
estejam familiarizadas com o programa. 


Flexibilidade: O Python já conta com módulos para diversas 
aplicações, científicas ou não, incluindo módulos para intera- 
ção com os protocolos mais comuns da Internet (FTP, HTTP, 
XMLRPC, etc.). A maior parte destes módulos já faz parte 
da distribuição básica do Python. 


Operação com arquivos: A manipulação de arquivos, tais como 
a leitura e escrita de dados em arquivos texto e binário, é 
muito simplificada no Python, facilitando a tarefa de muitos 


pesquisadores ao acessar dados em diversos formatos. 


Uso interativo: O Python pode ser utilizado interativamente, ou 
invocado para a execucão de scripts completos. O uso intera- 
tivo permite “experimentar” comandos antes de incluí-los em 
programas mais complexos, ou usar o Python simplesmente 
como uma, calculadora. 


etc... 


Entretanto, para melhor compreender todas estas vantagens 
apresentadas, nada melhor do que começar a explorar exemplos 
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de computação científica na linguagem Python. Mas para inspirar 
o trabalho técnico, nada melhor do que um poema: 
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>>> import this 
The Zen of Python, by Tim Peters 


Beautiful is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren’t special enough to break 
the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the 
temptation to guess. 

There should be one— and preferably only 
one —obvious way to do it. 

Although that way may not be obvious at 
first unless you’re Dutch. 

Now is better than never. 

Although never is often better than xrightx 
now. 

If the implementation is hard to explain, it 
*s a bad idea. 

If the implementation is easy to explain, it 
may be a good idea. 

Namespaces are one honking great idea — let 
’s do more of those! 

>>> 
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Usando este Livro 


Este livro foi planejado visando a versatilidade de uso. Sendo assim, 
ele pode ser utilizado como livro didático (em cursos formais) ou 
como referência pessoal para auto-aprendizagem ou consulta. 

Como livro didático, apresenta, pelo menos, dois níveis de apli- 
cação possíveis: 


1. Um curso introdutório à linguagem Python, no qual se faria 
uso dos capítulos da primeira parte. O único pré-requisito 
seria uma exposição prévia dos alunos a conceitos básicos 
de programação (que poderia ser condensada em uma única 
aula). 


2. Um curso combinado de Python e computação científica. O 
autor tem ministrado este tipo de curso com grande sucesso. 
Este curso faria uso da maior parte do conteúdo do livro, o 
instrutor pode selecionar capítulos de acordo com o interesse 
dos alunos. 


Como referência pessoal, este livro atende a um público bas- 
tante amplo, de leigos a cientistas. No início de cada capítulo 
encontram-se os pré-requisitos para se entender o seu conteúdo. 
Mas não se deixe inibir; as aplicações científicas são apresentadas 
juntamente com uma breve introdução à teoria que as inspira. 

Recomendo aos auto-didatas que explorem cada exemplo con- 
tido no livro; eles ajudarão enormemente na compreensão dos tó- 
picos apresentados”. Para os leitores sem sorte, que não dispõem 
de um computador com o sistema operacional GNU/Linux insta- 
lado, sugiro que o instalem, facilitará muito o acompanhamento dos 
exemplos. Para os que ainda não estão prontos para abandonar o 





TO código fonte do exemplos está disponível na seguinte URL: http:// 
fccoelho .googlepages.com/CCP code.zip 
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Windows™, instalem o Linux em uma máquina virtual?! A dis- 
tribuição que recomendo para iniciantes é o Ubuntu (www. ubuntu. 
com). 

Enfim, este livro foi concebido para ser uma leitura prazeirosa 
para indivíduos curiosos como eu, que estão sempre interessados 
em aprender coisas novas! 

Bom Proveito! Flávio Codeço Coelho 


Petrópolis, 2007 





8Recomendo o VirtualBox (www.virtualbox.org), é software livre e fan- 
tástico! 


Parte I 


Introducao ao Python e 
Ferramentas de 
Desenvolvimento 


Capitulo 1 


Fundamentos da Linguagem 


Breve introdução a conceitos básicos de programação e 
à linguagem Python. A maioria dos elementos básicos 
da linguagem são abordados neste capítulo, com exceção 
de classes, que são discutidas em detalhe no capítulo 2. 
Pré-requisitos: Conhecimentos básicos de programa- 
ção em qualquer linguagem. 


ESTE Capítulo, faremos uma breve introdução à linguagem 
Python. Esta introdução servirá de base para os exemplos 

dos capítulos subsequentes. Para uma introdução mais completa à 
linguagem, recomendamos ao leitor a consulta a livros e outros do- 
cumentos voltados especificamente para programação em Python. 


1.1 Primeiras impressões 
Para uma primeira aproximação à linguagem, vamos examinar suas 
características básicas. Façamos isso interativamente, a partir do 


console Python. Vejamos como invocá-lo: 


Listagem 1.1: O console interativo do Python 


1 $ python 
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2 Python 2.5.1 (r251:54863, May 2 2007, 


16:56:35) 

3 [GCC 4.1.2 (Ubuntu 4.1.2—Oubuntu4)] on 
linux2 

4 Type "help", "copyright", "credits" or " 


license" for more information. 
BUD 


Toda linguagem, seja ela de programação ou linguagem natural, 
possui um conjunto de palavras que a caracteriza. As linguagens 
de programação tendem a ser muito mais compactas do que as 
linguagens naturais. O Python pode ser considerado uma lingua- 
gem compacta, mesmo em comparação com outras linguagens de 
programação. 

As palavras que compõem uma linguagem de programação são 
ditas reservadas, ou seja, não podem ser utilizadas para nomear 
variáveis. Se o programador tentar utilizar uma das palavras re- 
servadas como variável, incorrerá em um erro de sintaxe. 


Listagem 1.2: Palavras reservadas não podem ser utilizadas como 
nomes de variáveis 


1 >>> for=1 
2 File "<stdin>", line 1 
3 for=1 
; x 
s SyntaxError: invalid syntax 

A linguagem Python em sua versão atual (2.5), possui 30 pala- 
vras reservadas. São elas: and, as, assert, break, class, continue, 
def, del, elif, else, except, exec, finally, for, from, global, 
if, import, in, is, lambda, not, or, pass, print, raise, return, 
try, while e yield. Além destas palavras, existem constantes, 
tipos e funções internas ao Python, que estão disponíveis para a 
construção de programas. Estes elementos podem ser inspeciona- 
dos através do comando dir(__builtins__). Nenhum dos ele- 
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mentos do módulo __builtins__ deve ser redefinido!. O console 
interativo do Python possui um sistema de ajuda integrado que 
pode ser usado para acessar a documentação de qualquer elemento 
da linguagem. O comando help(), inicia a ajuda interativa. A 
partir daí, podemos por exemplo, digitar keywords para acessar a 
ajuda das palavras reservadas listadas acima. Se digitarmos for 
em seguida, obteremos a seguinte ajuda: 


Listagem 1.3: Definição da palavra reservada for. 


7.3 The for statement 





=. 


The for statement is used to iterate over 
the elements of a sequence 

4 (such as a string, tuple or list) or other 

iterable object: 


w 

















1.2 Uso Interativo vs. Execução a Partir de 
Scripts 


Usuários familiarizados com ambientes de programação científicos 
tais como Matlab, R e similares, ficarão satisfeitos em saber que o 
Python também pode ser utilizado de forma interativa. Para isso, 
basta invocar o interpretador na linha de comando (Python shell, 
em Unix) ou invocar um shell mais sofisticado como o Idle, que 
vem com a distribuição padrão do Python, ou o Ipython (ver 4.1). 

Tanto no uso interativo, como na execução a partir de scripts, o 
interpretador espera encontrar apenas uma expressão por linha do 
programa. Caso se deseje inserir mais de uma expressão em uma 
linha, as expressões devem ser separadas por ;. Mas esta prática 





1 Atenção, os componentes de builtins |, não geram erros de sintaxe 
ao ser redefinidos. 
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deve ser evitada. Expressões podem continuar em outra linha se 
algum de seus parénteses, colchetes, chaves ou aspas ainda nao tiver 
sido fechado. Alternativamente, linhas podem ser quebradas pela 
aposição do caractere \ ao final da linha. 


Listagem 1.4: Usando o Python como uma calculadora. 


1 >>> 1+1 
2 2 
3 >>> 


No cabeçalho da shell do Python, acima (listagem 1.1), o interpre- 
tador identifica a versão instalada, data e hora em que foi compi- 
lada, o compilador C utilizado, detalhes sobre o sistema operacional 
e uma linhazinha de ajuda para situar o novato. 

Para executar um programa, a maneira usual (em Unix) é digi- 
tar: python script.py. No Windows basta um duplo clique sobre 
arquivos *.py. 


Listagem 1.5: Executando script.py via comando de linha. 


1 $ python script.py 


No Linux e em vários UNIXes, podemos criar scripts que são 
executáveis diretamente, sem precisar invocar o interpretador an- 
tes. Para isso, basta incluir a seguinte linha no topo do nosso 
script: 





&! /usr/bin/env python 


a 

















Note que os caracteres #! devem ser os dois primeiros caracteres 
do arquivo (como na listagem 1.6). 

Depois, resta apenas ajustar as permissões do arquivo para que 
possamos executá-lo: chmod +x script.py (listagem 1.7). 


Listagem 1.7: Executando um script Python executável. 


1 $ chmod +x script .py 
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Listagem 1.6: Tornando um script executável 





1%! /usr/bin/env python 


3| print "Alô Mundo!" 














2 $ ./script.py 
3 sys:l: DeprecationWarning: Non—ASCII 
character ’\xf4’ in file ./teste on line 
3, but no encoding declared; see http 
://www. python. org/peps/pep—0263.html for 
details 
4 Alô Mundo! 


Mas que lixo é aquele antes do nosso “Alô mundo”? Trata- 
se do interpretador reclamando do acento circunflexo em “Alô”. 
Para que o Python não reclame de acentos e outros caracteres da 
língua portuguesa não contidos na tabela ASCII, precisamos adi- 
cionar a seguinte linha ao script: # -*- coding: latin-1 -*-. 
Experimente editar o script acima e veja o resultado. 

No exemplo da listagem 1.6, utilizamos o comando print para 
fazer com que nosso script produzisse uma string como saída, ou 
seja, para escrever no stdout?. Como podemos receber informa- 
ções pelo stdin? O Python nos oferece duas funções para isso: 
input(?texto?), que executa o que o usuário digitar, sendo por- 
tanto perigoso, e raw_input(’texto’), que retorna uma string 
com a resposta do usuário. 

Nas listagens que se seguem, alternaremos entre a utilização 
de scripts e a utilização do Python no modo interativo (como na 
listagem 1.4). A presença do símbolo “>>>”, característico da shell 





2Todos os processos no Linux e outros sistemas operacionais possuem vias 
de entrada e saída de dados denominados de stdin e stdout, respectivamente. 
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do Python sera suficiente para diferenciar os dois casos. Exemplos 
de scripts virão dentro de caixas. 
Operações com Números 


Noventa e nove por cento das aplicações científicas envolvem algum 
tipo de processamento numérico. Vamos iniciar nosso contato com 
o Python através dos números (Listagem 1.8). 


Listagem 1.8: Operações aritméticas 
>>> 242 


>>> # Comentário 
2x2 


>>> 2++2 # Comentário na mesma linha 


>>> (50-56) /4 


© ON DH RB V YB 
A 


>>> # Divisão de inteiros retorna "floor": 


7/3 


H 
© 


=. 
a 


2 
>>> 7/-3 

—3 

>>> 7/8. 
2.3333333333333335 


=. e RB RB 
ao FF WwW N 


=. 
o 


Nosso primeiro exemplo numérico (Listagem 1.8)°, trata núme- 
ros em sua representação mais simples: como constantes. É desta 
forma que utilizamos uma calculadora comum. Em programação 
é mais comum termos números associados a quantidades, a que 





3Repare como o Python trata a divisão de dois inteiros. Ela retorna o 
resultado arredondado para baixo 
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precisamos nos referenciar e que podem se modificar. Esta repre- 
sentação de números chama-se variável. 

O sinal de = é utilizado para atribuir valores a variáveis(Listagem 
1.9). 


Listagem 1.9: Atribuindo valores 


>>> largura = 20 
>>> altura = 5x9 
>>> largura * altura 
900 


e ù NO e 


Um valor pode ser atribuído a diversas variáveis com uma única 
operação de atribuição, ou múltiplos valores a múltiplas variáveis 
(Listagem 1.10). Note que no exemplo de atribuição de múltiplos 
valores a múltiplas variáveis (Listagem 1.10, linha 9) os valores 
poderiam estar em uma tupla. 


Listagem 1.10: Atribuindo o mesmo valor a múltiplas variáveis 





>>> x y Z O # Zero x, yez 
>>> X 

0 

>>> y 

0 

>>> Z 

0 

>>> a,b,c=1,2,3 
>>> a 

1 

>>> b 

2 

>>> € 

3 





O o ND eo A w N e 


BoB Be e H 
e ù NM HO 


O Python também reconhece números reais (ponto-flutuante) 
e complexos naturalmente. Em operações entre números reais e 
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inteiros o resultado será sempre real. Da mesma forma, operações 
entre números reais e complexos resultam sempre em um número 
complexo. Números complexos são sempre representados por dois 
números ponto-flutuante: a parte real e a parte imaginária. A 
parte imaginária é representada com um sufixo “9” ou “J”. 


Listagem 1.11: Números complexos 
>>> 1) * 1J 
(-1+03) 
>>> 1j * complex (0,1) 
(-1+05) 
>>> 3+15*3 
(3+3)) 
>>> (3+1j)*3 
(9+35) 
>>> (1+25)/(1+15) 
(1.5+0.55) 








O o N QA oao A w mm 





=. 
© 


Um Número complexo para o Python, é um objeto*. Podemos ex- 
trair as partes componentes de um número complexo c utilizando 
atributos do tipo complexo: c.real e c.imag. A função abs, que 
retorna o módulo de um numero inteiro ou real, retorna o compri- 
mento do vetor no plano complexo, quando aplicada a um número 
complexo. O módulo de um número complexo é também denomi- 
nado magnitude (listagem 1.12). 


Listagem 1.12: Explorando números complexos 
>>> a=3.0+3.0j 
>>> a.real 
3.0 
>>> a.imag 
3.0 
>>> abs(a) # sqrt(a.real**x2 + a.imag**2) 


a an e Ù N m 





4 Assim como os outros tipos de números. 
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7 4.2426406871192848 


1.3 Nomes, Objetos e Espaços de Nomes 


Nomes em Python são identificadores de objetos, e também são 
chamados de variáveis. Nomes devem ser iniciados por letras maiús- 
culas ou minúsculas e podem conter algarismos, desde que não se- 
jam o primeiro caractere. O Python faz distinção entre maiúsculas 
e minúsculas portanto, nome != Nome. 

No Python, todos os dados são objetos tipados, que são associ- 
ados dinamicamente a nomes. O sinal de igual (=), liga o resultado 
da avaliação da expressão do seu lado direito a um nome situado 
à sua esquerda. A esta operação damos o nome de atribuição (ver 
exemplo na listagem 1.13). 


Listagem 1.13: Atribuindo objetos a nomes (variáveis) 


1 >>> a 3+2x+7 
2 >>> a,b = (“laranja ”,'banana”) 


As variáveis criadas por atribuição ficam guardadas na memória 
do computador. Para evitar preenchimento total da memória, as- 
sim que um objeto deixa de ser referenciado por um nome (deixa de 
existir no espaço de nomes corrente), ele é imediatamente apagado 
da memória pelo interpretador. 

O conceito de espaço de nomes é uma característica da lingua- 
gem Python que contribui para sua robustez e eficiência. Espaços 
de nomes são dicionários (ver 1.4) contendo as variáveis, objetos 
e funções disponíveis durante a execução de um programa. A um 
dado ponto da execução de um programa, existem sempre dois di- 
cionários disponíveis para a resolução de nomes: um local e um 
global. Estes dicionários podem ser acessados para leitura através 
das funções locals() e globals(), respectivamente. Sempre que 
o interpretador Python encontra uma palavra que não pertence ao 
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conjunto de palavras reservadas da linguagem, ele a procura, pri- 
meiro no espaco de nomes local e depois no global. Se a palavra 
não é encontrada, um erro do tipo NameError é acionado (exemplo 
1.14). 


Listagem 1.14: Exemplo de NameError 


1 >>> maria 

2 Traceback (most recent call last): 

3 File "<stdin>", line 1, in ? 

4 NameError: name ’maria’ is not defined 


O espaço de nomes local, muda ao longo da execução de um 
programa. Toda a vez que a execução adentra uma função, o espaço 
de nomes local passa a refletir apenas as variáveis definidas dentro 
daquela função”. Ao sair da função, o dicionário local torna-se 


igual ao global. 


1 >>> al 

2 >>> len(globals() .items()) 
3 4 

4 >>> len(locals() .items()) 
5 4 

6 >>> def fun(): 

7 a=’novo valor’ 

8 print len(locals().items() ) 
9 print a 

10 eae 

11 >>> fun () 

12 1 


Hm 
w 


novo valor 

>>> print a 

1 

>>> len(locals().items()) 


e e e 
D oa e 





5 Mais quaisquer variáveis explicitamente definidas como globais 


1.4. ESTRUTURAS DE DADOS 13 





17 5 

18 >>> locals () 

19 {’ builtins | *: <module ’__builtin__?° ( 
built-in)>, ’_ name °: "main _’°, “fun 
>: <function fun at Oxb7cl8ed4>, ’ 
__doc__’: None, ’a’: 1} 


Também é importante lembrar que o espaco de nomes local 
sempre inclui os __builtins__ como vemos na listagem 1.3. 


1.4 Estruturas de Dados 


Qualquer linguagem de programação pode ser simplisticamente 
descrita como uma ferramenta, através da qual, dados e algorit- 
mos são implementados e interagem para a solução de um dado 
problema. Nesta seção vamos conhecer os tipos e estruturas de 
dados do Python para que possamos, mais adiante, utilizar toda a 
sua flexibilidade em nossos programas. 

No Python, uma grande ênfase é dada à simplicidade e à flexibi- 
lidade de forma a maximizar a produtividade do programador. No 
tocante aos tipos e estruturas de dados, esta filosofia se apresenta 
na forma de uma tipagem dinâmica, porém forte. Isto quer dizer 
que os tipos das variáveis não precisam ser declarados pelo pro- 
gramador, como é obrigatório em linguagens de tipagem estática 
como o C, FORTRAN, Visual Basic, etc. Os tipos das variáveis 
são inferidos pelo interpretador. As principais estruturas de dados 
como Listas e Dicionários, podem ter suas dimensões alteradas, 
dinamicamente durante a execução do Programa , o que facilita 
enormemente a vida do programador, como veremos mais adiante. 


Listas 


As listas formam o tipo de dados mais utilizado e versátil do 
Python. Listas são definidas como uma sequência de valores se- 
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parados por virgulas e delimitada por colchetes: 


Listagem 1.15: Criando listas. 


1 >>> lista=[1, ’a’, 'pe'] 
2 >>> lista 

3 [1, “a”, ’pe’] 

4 >>> lista [0] 

5 1 

6 >>> lista [2] 

7 'pe' 

s >>> lista [—1] 

9 'pe' 


Na listagem 1.15, criamos uma lista de três elementos. Uma 
lista é uma sequência ordenada de elementos, de forma que pode- 
mos selecionar elementos de uma lista por meio de sua posição. 
Note que o primeiro elemento da lista é lista[0]. Todas as con- 
tagens em Python começam em 0. 

Uma lista também pode possuir elementos de tipos diferentes. 
Na listagem 1.15, o elemento 0 é um inteiro enquanto que os ou- 
tros elementos são strings. Para verificar isso, digite o comando 
type(lista[0]). 

Uma caracteristica muito interessante das listas do Python, é 
que elas podem ser indexadas de trás para frente, ou seja, lista[-1] 
é o último elemento da lista. Como listas são sequências de tama- 
nho variável, podemos assessar os últimos n elementos, sem ter que 
contar os elementos da lista. 

Listas podem ser “fatiadas”, ou seja, podemos selecionar uma 
porção de uma lista que contenha mais de um elemento. 


Listagem 1.16: Fatiando uma lista 
1 >>> lista=[’a’,’pe’, “que”, 1] 
2 >>> lista [1:38] 
E [pe "que”] 
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4 >>> lista [—1] 
5 1 

6 >>> lista [3] 
zl 

E >>> 


O comando lista[1:3], delimita uma “fatia” que vai do ele- 
mento 1 (o segundo elemento) ao elemento imediatamente anterior 
ao elemento 3. Note que esta seleção inclui o elemento correspon- 
dente ao limite inferior do intervalo, mas não o limite superior. 
Isto pode gerar alguma confusão, mas tem suas utilidades. Índices 
negativos também podem ser utilizados nestas expressões. 

Para retirar uma fatia que inclua o último elemento, temos que 
usar uma variação deste comando seletor de intervalos: 


Listagem 1.17: Selecionando o final de uma lista. 


1 >>> lista [2:] 
2 [’que’, 1] 
3 >>> 


Este comando significa todos os elementos a partir do elemento 
2 (o terceiro), até o final da lista. Este comando poderia ser uti- 
lizado para selecionar elementos do início da lista: lista[:3], só 
que desta vez não incluindo o elemento 3 (o quarto elemento). 

Se os dois elementos forem deixados de fora, são selecionados 
todos os elementos da lista: 


Listagem 1.18: selecionando todos os elementos de uma lista. 
1 >>> lista [:] 


3 ? 2 2 7 2 
2 [’a’, ’pe’, que’, 1] 
D A 
Só que não é a mesma lista, é uma nova lista com os mesmos 
elementos. Desta forma, lista[:] é uma maneira de fazer uma 


cópia completa de uma lista. Normalmente este recurso é utilizado 
junto com uma atribuição a = lista[:]. 


16 CAPITULO 1. FUNDAMENTOS DA LINGUAGEM 


Listagem 1.19: Adicionando elementos a listas. 


1 >>> lista[:] 
Pa’, “pe”, 


YN 


b) b) | b) 
[ a z pe 3 


e w 


or 


>>> lista 
Pa’, ? 
>>> 


on o 


, 
>>> lista . insert (2, 


“que”, 1] 
>>> lista .append(2) adiciona 2 ao final 
“que”, 1, 2] 
[’a’,’b’]) 


pe’, Pa’, ’b’], “que”, 1, 2] 


As listas são conjuntos mutáveis, ao contrário de tuplas e strings, 
portanto pode-se adicionar(listagem 1.19), modificar ou remover 
(tabela 1.1) elementos de uma lista. 


Tabela 1.1: Métodos de Listas. 





Método 


Efeito 





L.append(objeto) 
L.count (elemento) 
L.extend( list ) 
L.index(value) 
L.insert (i, 0) 
L.pop([indice ]) 


L.remove(value) 
L.reverse () 
L. sort () 





Adiciona um elemento ao final da lista. 
Retorna o ntimero de ocorréncias do elemento. 
Concatena listas. 

Retorna indice da primeira ocorréncia do valor. 
Insere objeto (0) antes de indice (i). 

Remove e retorna objeto no indice. 

ou o último elemento. 

remove primeira ocorrência do valor. 

Inverte lista. In situ 

Ordena lista. In locus 





Note que as operações in situ não alocam memória extra para 
a operação, ou seja, a inversão ou a ordenação descritas na tabela 
1.1, são realizadas no mesmo espaço de memória da lista original. 
Operações in situ alteram a variável em si sem fazer uma cópia da 
mesma e, portanto não retornam nada. 

O método L. insert insere um objeto antes da posição indicada 
pelo índice. Repare, na listagem 1.19, que o objeto em questão era 
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uma lista, e o método insert nao a fundiu com a lista original. Este 
exemplo nos mostra mais um aspecto da versatilidade do objeto 
lista, que pode ser composto por objetos de qualquer tipo. 


Listagem 1.20: Estendendo uma lista. 
1 >>> lista2=[’a’,’b’] 
2 >>> lista .extend(lista2) 
3 >>> lista 
4 [’a’, “pe”, [’a’, ’b’], “que”, 1, 2, ’a’, ºb 
| 
Já na listagem 1.20, os elementos da segunda lista são adicio- 
nados, individualmente, ao final da lista original. 


Listagem 1.21: Efetuando buscas em listas. 
1 >>> lista .index("que”) 


23 

3 >>> lista.index(’a’) 

4 0 

5 >>> lista.index(’z’) 

e Traceback (most recent call last): 

7 File "<input>", line 1, in ? 

s ValueError: list .index(x): x not in list 
ə >>> ’z’ in lista 

10 0 


Conforme ilustrado na listagem 1.21, o método L. index retorna 
o índice da primeira ocorrência do valor dado. Se o valor não 
existir, o interpretador retorna um ValueError. Para testar se um 
elemento está presente em uma lista, pode-se utilizar o comando 
in® como ilustrado na listagem 1.21. Caso o elemento faça parte 
da lista, este comando retornará 1, caso contrário retornará 0”. 





80 inverso do operador in, é o operador not in e também é válido para 
todas as sequências. 

"Verdadeiro e falso: Em Python, quase qualquer coisa pode ser utilizada 
em um contexto booleano, ou seja, como verdadeiro ou falso. Por exemplo 0 é 
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Existem dois métodos básicos para remover elementos de uma 
lista: L.remove e L.pop — listagem 1.22. O primeiro remove o 
elemento nomeado sem nada retornar, o segundo elimina e retorna 
o último ou o elemento da lista (se chamado sem argumentos), ou o 
determinado pelo índice, passado como argumento (Listagem 1.22). 


Listagem 1.22: Removendo elementos de uma lista. 


1 >>> lista .remove(" que") 
>>> lista 


2 

3 [’a’, ’pe’, [’a’, ’b’], 1, 2, ’a’, *b'] 
4 >>> lista.pop(2) 

5 [’a’, ’b’] 

6 >>> lista 

7 [’a’, ’pe’, 1, 2, ’a’, ºb'] 

8 >>> 


Operadores aritméticos também podem ser utilizados para ope- 
rações com listas. O operador de soma, “+”, concatena duas listas. 
O operador “+=” é um atalho para o método L.extend conforme 
mostrado na listagem 1.23. 


Listagem 1.23: Operações com listas 


1 >>> lista=[’a’, ’pe’, 1, 2, “a”, ’b’] 

2 >>> lista = lista + [| novo’, ’elemento’| 
3 >>> lista 

4 [’a’, ’pe’, 1, 2, “a”, ’b’, ’novo’, ’ 


elemento ’ | 
5 >>> lista += ‘dois’ 
6 >>> lista 
Ppa’, “pe”, 1, 2. a’, *b’, ro eae "Ot dao b) 
s”] 
a >>> lista += [’dois’] 


q 





falso enquanto que todos os outros números são verdadeiros.Uma string, lista, 
dicionário ou tupla vazias são falsas enquanto que as demais são verdadeiras. 
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Listagem 1.24: Criando listas numéricas sequenciais. 





>>> range (10) 

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 

>>> range (2,20 ,2)#ntmeros pares 

[2, 4, 6, 8, 10, 12, 14, 16, 18] 
>>> range(1,20,2)#ntimeros ímpares 
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19] 


a an èe Ù N e 

















ə >>> lista 

10 [’a’, “pel, 1, 2, ’a’, "br, ’d’, tor, Ci”, 
s’, ’dois’|] 

u >>> li=[1,2] 

12 >>> li x3 

13 [1, 2, 1, 2, 1, 2] 

14 >>> 


Note que a operação lista = lista + lista2 cria uma nova 
lista enquanto que o comando += aproveita a lista original e a 
extende. Esta diferença faz com que o operador += seja muito 
mais rápido, especialmente para grandes listas. O operador de 
multiplicação, ‘‘*’’, é um repetidor /concatenador de listas conforme 
mostrado ao final da listagem 1.23. A operação de multiplicação 
in situ(*=) também é válida. 


Um tipo de lista muito útil em aplicações científicas, é lista 
numérica sequencial. Para construir estas listas podemos utilizar o 
comando range (exemplo 1.24). O comando range aceita 1, 2 ou 
três argumentos: início, fim e passo, respectivamente (ver exemplo 
1.24). 
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Tuplas 


Uma tupla, é uma lista imutável, ou seja, ao contrário de uma lista, 
após a sua criação, ela não pode ser alterada. Uma tupla é definida 
de maneira similar a uma lista, com exceção dos delimitadores do 
conjunto de elementos que no caso de uma tupla são parênteses 
(listagem 1.25). 


Listagem 1.25: Definindo uma Tupla. 


$ 


ı >>> tu = (’Genero’, ’especie’, ’peso’, 
estagio’) 

>>> tu [0] 

"Genero 

>>> tu [1:3] 

("especie ”, "peso ”) 

>>> 


a ona è wo N 


Os elementos de uma tupla podem ser referenciados através de 
índices, (posição) de forma idêntica a como é feito em listas. Tuplas 
também podem ser fatiadas, gerando outras tuplas. 

As tuplas não possuem métodos. Isto se deve ao fato de as 
tuplas serem imutáveis. Os métodos append, extend, e pop natu- 
ralmente não se aplicam a tuplas, uma vez que não se pode adicio- 
nar ou remover elementos de uma tupla. Não podemos fazer busca 
em tuplas, visto que não dispomos do método index. No entanto, 
podemos usar in para determinar se um elemento existe em uma 
tupla, como se faz em listas. 


Listagem 1.26: Outras formas de definir tuplas. 


ı >> tu=() 

2 >>> tu 

3 O 

4 >>> tu=’casa’, Repare na vírgula ao 
final! 


5 >>> tu 
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oe (’casa’,) 

7 >>> tu=1,2,3,4 
a >>> tu 

ə (1, 2, 3, 4) 

10 >>> var =W,xX,y,Z 
11 >>> var 


i2 (W,X,Y 52) 

13 >>> var = tu 
14 >>> W 

15 1 

16 >>> X 

17 2 

18 >>> y 

19 3 

20 >>> Z 

2 4 


Conforme exemplificado em 1.26, uma tupla vazia, é definida 
pela expressão (), já no caso de uma tupla unitária, isto é, com ape- 
nas um elemento, fazemos a atribuição com uma vírgula após o ele- 
mento, caso contrário (tu=(? casa”) ), o interpretador não poderá 
distinguir se os parênteses estão sendo utilizados como delimitado- 
res normais ou delimitadores de tupla. O comando tu=(’ casa’, ) 
é equivalente ao apresentado na quarta linha da listagem 1.26, ape- 
nas mais longo. 

Na sétima linha da listagem 1.26, temos uma extensão do con- 
ceito apresentado na linha anterior: a definição de uma tupla sem 
a necessidade de parênteses. A este processo, se dá o nome de em- 
pacotamento de sequência. O empacotamento de vários elementos 
sempre gera uma tupla. 

As tuplas, apesar de não serem tão versáteis quanto as listas, são 
mais rápidas. Portanto, sempre que se precisar de uma sequénca 
de elementos para servir apenas de referência, sem a necessidade 
de edição, deve-se utilizar uma tupla. Tuplas também são úteis na 
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formatação de strings como veremos na listagem 1.28. 

Apesar das tuplas serem imutáveis, pode-se contornar esta li- 
mitação fatiando e concatenando tuplas. Listas também podem 
ser convertidas em tuplas, com a função tuple(lista), assim 
como tuplas podem ser convertidas em listas através da função 
list (tupla). 

Uma outra aplicação interessante para tuplas, mostrada na lis- 
tagem 1.26, é a atribuição múltipla, em que uma tupla de valores, é 
atribuída a uma lista de nomes de variáveis armazenados em uma 
tupla. Neste caso, as duas sequências devem ter, exatamente, o 
mesmo número de elementos. 


Strings 


Strings são um terceiro tipo de sequências em Python. Strings são 
sequências de caracteres delimitados por aspas simples, ’string345’ 
ou duplas "string". Todos os operadores discutidos até agora para 
outras sequências, tais como +, *, in, not in, s[i] es[i:j], tam- 
bém são válidos para strings. Strings também podem ser definidas 
com três aspas (duplas ou simples). Esta última forma é utilizada 
para definir strings contendo quebras de linha. 


Listagem 1.27: Strings. 


>>> st=’123 de oliveira4’ 
>>> len(st) 


>>> min(st) 

>>> max(st) 

>>> texto = """ primeira linha 
segunda linha 


terceira linha 
>>> print texto 


o o y QO oao A U N Hm 


nua 


=. 
© 


=. 
=. 
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12 primeira linha 
13 segunda linha 
14 terceira linha 


Conforme ilustrado na listagem 1.27, uma string é uma sequên- 
cia de quaisquer caracteres alfanuméricos, incluindos espaços. A 
função len(), retorna o comprimento da string, ou de uma lista 
ou tupla. As funções min() e max() retornam o valor mínimo e o 
máximo de uma sequência, respectivamente. Neste caso, como a 
sequência é uma string, os valores são os códigos ASCII de cada 
caracter. Estes comandos também são válidos para listas e tuplas. 

O tipo String possui 33 métodos distintos (na versão 2.2.1 do 
Python). Seria por demais enfadonho listar e descrever cada um 
destes métodos neste capítulo. Nesta seção vamos ver alguns mé- 
todos de strings em ação no contexto de alguns exemplos. Outros 
métodos aparecerão em outros exemplos nos demais capítulos. 

O uso mais comum dado a strings é a manipulação de textos que 
fazem parte da entrada ou saída de um programa. Nestes casos, 
é interessante poder montar strings, facilmente, a partir de outras 
estruturas de dados. Em Python, a inserção de valores em strings 
envolve o marcador hs. 


Listagem 1.28: Formatando strings. 


1 >>> animal=' Hamster 1º 

2 >>> peso-98 

3 >> '%s: %s gramas’ % (animal , peso) 
4 "Hamster 1: 98 gramas’ 


Na listagem 1.28, temos uma expressão de sintaxe não tão ób- 
via mas de grande valor na geração de strings. O operador % (mó- 
dulo), indica que os elementos da tupla seguinte serão mapeados, 
em sequência, nas posições indicadas pelos marcadores 4s na string. 

Esta expressão pode parecer uma complicação desnecessária 
para uma simples concatenação de strings. Mas não é. Vejamos 
porquê: 
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Listagem 1.29: Problemas com a concatenação de strings. 


>>> animal=' Hamster 1’ 

>>> peso-98 

>>> '%s: %s gramas” % (animal, peso) 

"Hamster 1: 98 gramas’ 

>>> animal+’: ’+peso+’ gramas’ 

Traceback (most recent call last): 
File "<input>", line 1, in ? 

TypeError: cannot concatenate 

’ objects 


on fom we FF O N e 


b) b) b) 


str’ and “int 


9 >>> 


Pelo erro apresentado na listagem 1.29, vemos que a formatação 
da string utilizando o operador módulo e os marcadores 4s, faz mais 
do que apenas concatenar strings, também converte a variável peso 
(inteiro) em uma string. 


Dicionários 


O dicionário é um tipo de dado muito interessante do Python: É 
uma estrutura que funciona como um banco de dados em minia- 
tura, no sentido de que seus elementos consistem de pares “chave 
: valor”, armazenados sem ordenação. Isto significa que não exis- 
tem índices para os elementos de um dicionário, a informação é 
acessada através das chaves. 


Listagem 1.30: Criando e manipulando dicionários. 


ı >>> Z={°C’:12, "ORIG, ?N?:12, Na 40} 
2 >>> Z["0'] 

a 16 

4 >>> Z[’H’|=1 

5 >>> Z 

e { Na’: 40, °C’: 12, °H’: 1, PO" 16, NS; 


12} 
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7 >>> Z.keys() 

8 [ Na’, O, Hº, O", Nº] 
9 >>> Z.has_key(’N’) 

10 1 


As chaves podem ser de qualquer tipo imutável: números, strings, 
tuplas (que contenham apenas tipos imutáveis). Dicionários pos- 
suem os métodos listados na tabela 1.2. 

Os conjuntos (chave:valor) são chamados de ítens do dicioná- 
rios. Esta terminologia é importante pois podemos acessar, sepa- 
radamente, chaves, valores ou ítens de um dicionário. 

Os valores de um dicionário podem ser de qualquer tipo, núme- 
ros, strings, listas, tuplas e até mesmo outros dicionários. Também 
não há qualquer restrição para o armazenamento de diferentes tipos 
de dados em um mesmo dicionário. 

Conforme exemplificado em 1.30, pode-se adicionar novos ítens 
a um dicionário, a qualquer momento, bastando atribuir um valor 
a uma chave. Contudo, é preciso ter cuidado. Se você tentar criar 
um ítem com uma chave que já existe, o novo ítem substituirá o 
antigo. 

Os métodos D.iteritems(), D.iterkeys() e D.itervalues() 
criam iteradores. Iteradores permitem iterar através dos ítens, cha- 
ves ou valores de um dicionário. Veja a listagem 1.31: 


Listagem 1.31: Iterando dicionários. 


1 >>> Z.items() 

2 [(’Na’, 40), (’C’, 12), (EĦE’, 1), ('0”, 16), 
CN", 12)] 

>>> i=Z.iteritems () 

>>> i 

<dictionary—iterator object at 0x8985d00> 

>>> i.next() 

(° Na’, 40) 

>>> i.next() 


ory nna AÀA Ww 
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Tabela 1.2: Métodos de Dicionários. 








Método Efeito 
D.clear () Remove todos os itens do dicionário. 
D.copy() Cria uma cópia de um dicionário. 


D.get(k[,d]) 
D.has key(k) 
D.items() 
D.iteritems () 
D.iterkeys () 
D. itervalues () 
D.keys() 
D.popitem() 
D.update(E) 
D.values() 





Retorna D[k], se a chave k existir. Senão, d. 
Retorna 1 se D possuir a chave k. 

Retorna lista de tuplas (chave:valor). 
Retorna objeto iterador para D. 

Idem para chaves. 

Idem para valores. 

Retorna lista com todas as chaves. 

Remove e retorna um ítem (chave:valor). 
Copia itens de E para D. 

Retorna lista com todas os valores. 





9 (’C’, 12) 


10 >>> # e assim por diante... 
u >>> k-Z.iterkeys() 
12 >>> k. next () 


13 ° Na’ 
14 >>> k.next() 
15 °C’ 
16 >>> k. next () 
17 7H’ 
is >>> k. next () 
19 HOM 
2 >>> k. next () 
21 N?’ 


22 >>> k.next() 


23 Traceback (most recent call 
"<input>", 


24 File 


last): 
line 1, in ? 


22 StopIteration 
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O uso de iteradores é interessante quando se precisa acessar 
o conteúdo de um dicionário, elemento-a-elemento, sem repetição. 
Ao final da iteração, o iterador retorna um aviso: StopIteration. 


Conjuntos 


Reafirmando sua vocação científica, a partir da versão 2.4, uma 
estrutura de dados para representar o conceito matemático de con- 
junto foi introduzida na linguagem Python. Um conjunto no Python 
é uma coleção de elementos sem ordenação e sem repetições. O 
objeto conjunto em Python aceita operações matemáticas de con- 
juntos tais como união, interseção, diferença e diferença simétrica 
(exemplo 1.4). 


1 >>> a = set(’pirapora’) 

>>> b = set (’paranapanema’ ) 

>>> a #letras em a 

set([’i’, ’p’, ’r’, ’a’, ’o’]) 

5 >>> a — b #Letras em a mas não em b 


e ow N 


6 set([’i’, ’o’]) 

7 >>> a | b #letras em a ou b 

8 set ([’a’, “e”, in ee m’, “0”, “ne, “pp”, a 
1 


9 >>> a & b #letras em a e b 
1 set([’a’, ’p’, ’r’]) 
1 >>> a ^ b #letras em a ou b mas não em ambos 


b) b) f 3 3 b) 


12 set([’i’, m’, ’e’, ’o’, ’n’]) 


No exemplo 1.4 pode-se observar as seguintes correspondéncias en- 
tre a notação do Python e a notação matemática convencional: 


a-b: A— Bº 
a|b: AUB 





8Por convenção representa-se conjuntos por letras maiúsculas. 
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a&b: ANB 
a”b: (AU B)-— (ANB) 


1.5 Controle de fluxo 


Em condições normais o interpretador executa as linhas de um 
programa uma a uma. As exceções a este caso são linhas perten- 
centes à definição de função e classe, que são executadas apenas 
quando a respectiva função ou classe é chamada. Entretanto algu- 
mas palavras reservadas tem o poder de alterar a direção do fluxo 
de execução das linhas de um programa. 


Condições 


Toda linguagem de programação possui estruturas condicionais que 
nos permitem representar decisões: “se isso, faça isso, caso contrário 
faça aquilo”. Estas estruturas também são conhecidas por ramifica- 
ções. O Python nos disponibiliza três palavras reservadas para este 
fim: if , elif e else. O seu uso é melhor demonstrado através de 
um exemplo (Listagem 1.32). 


Listagem 1.32: Exemplo do emprego de ramificações. 





if a = 
#este bloco é executado se a for 1 
pass 

elif a — 2: 
#este bloco é executado se a for 2 
pass 

else: 
#este bloco é executado se 
#se se nenhum dos blocos 
#anteriores tiver sido executado 
pass 


O © ND ao AÀA O N e 


nom 
= oO 
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No exemplo 1.32, vemos também emprego da palavra reservada 
pass, que apesar de não fazer nada é muito útil quando ainda não 
sabemos quais devem ser as consequências de determinada condi- 
ção. 

Uma outra forma elegante e compacta de implementar uma 
ramificação condicional da execução de um programa é através de 
dicionários (Listagem 1.33). As condições são as chaves de um 
dicionário cujos valores são funções. Esta solução não contempla o 
else, porém. 


Listagem 1.33: Implementando a funcionalidade de if e elif por 
meio de um dicionário. 


desfechos = (1:funl,2:fun2) 
desfechos [a] 





=. 


N 














Iteração 


Muitas vezes em problemas computacionais precisamos executar 
uma tarefa, repetidas vezes. Entretanto não desejamos ter que es- 
crever os mesmos comandos em sequência, pois além de ser uma 
tarefa tediosa, iria transformar nosso “belo” programa em algo si- 
milar a uma lista telefônica. A solução tradicional para resolver 
este problema é a utilização de laços (loops) que indicam ao inter- 
pretador que ele deve executar um ou mais comandos um número 
arbitrário de vezes. Existem vários tipos de laços disponíveis no 
Python. 


O laço while: O laço while repete uma tarefa enquanto uma 
condição for verdadeira (Listagem 1.34). Esta tarefa consiste em 
um ou mais comandos indentados em relação ao comando que inicia 
o laço. O fim da indentação indica o fim do bloco de instruções 
que deve ser executado pelo laço. 
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Listagem 1.34: Comandos de laço no Python. 


>>> while True: 
pass#repete indefinidamente 
>>> 1-0 
>>> while i < 10: 
i +=1 
print i 
# saida omitida 
>>> for i in range(1): 
print i 


O wm y QO oa A U N Be 


O laço for: O laço for nos permite iterar sobre uma sequên- 
cia atribuindo os elementos da mesma a uma variável, sequencial- 
mente, à medida que prossegue. Este laço se interrompe automa- 
ticamente ao final da sequência. 


Iteração avançada: O Python nos oferece outras técnicas de 
iteração sobre sequências que podem ser bastante úteis na redu- 
ção da complexidade do código. No exemplo 1.31 nós vimos que 
dicionários possuem métodos específicos para iterar sobre seus com- 
ponentes. Agora suponhamos que desejássemos iterar sobre uma 
lista e seu índice? 


Listagem 1.35: A função enumerate. 
1 >>> for n,e in enumerate([’a’,’b’,’c’,’d’,’e 
J): 
print "%s: %s"%(n,e) 


w% 3 ow AÀA O N 


Rone Oo 
vv Lo To 
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A função enumerate (exemplo 1.35) gera um iterador similar ao 
visto no exemplo 1.31. O laço for chama o método next deste ite- 
rador repetidas vezes, até que receba a mensagem StopIteration 
(ver exemplo 1.31). 

O comando zip nos permite iterar sobre um conjunto de seqtien- 
cias pareando sequencialmente os elementos das múltiplas listas 
(exemplo 1.36). 


Listagem 1.36: Iterando sobre mais de uma sequência. 
>>> perguntas = [’nome’,’cargo’,’ partido’ | 
>>> respostas = [’Lula’,’Presidente’, ’PT’] 
>>> for p,r in zip(perguntas, respostas): 

print "qual o seu %s? %s"%(p,r) 


qual o seu nome? Lula 
qual o seu cargo? Presidente 
qual o seu partido? PT 


o o | Det A U N e 


Podemos ainda desejar iterar sobre uma sequência em ordem 
reversa (exemplo 1.5), ou iterar sobre uma sequência ordenada sem 
alterar a sequência original (exemplo 1.37). Note que no exemplo 
1.37, a lista original foi convertida em um conjunto (set) para 
eliminar as repetições. 


>>> for i in reversed(range(5)): 
print i 


N DO no B V N e 


SHANC a 


Listagem 1.37: Iterando sobre uma sequência ordenada. 
1 >>> for i in sorted(set(1l)): 


32 CAPITULO 1. FUNDAMENTOS DA LINGUAGEM 


print i 


Y 


laranja 
leite 
manga 

6 OVOS 

7 uva 


e ow 


or 


Iterações podem ser interrompidas por meio da palavra reser- 
vada break. Esta pode ser invocada quando alguma condição se 
concretiza. Podemos também saltar para a próxima iteração (sem 
completar todas as instruções do bloco) por meio da palavra re- 
servada continue. A palavra reservada else também pode ser 
aplicada ao final de um bloco iterativo. Neste caso o bloco definido 
por else só será executado se a iteração se completar normalmente, 
isto é, sem a ocorrência de break. 


Lidando com erros: Exceções 


O método da tentativa e erro não é exatamente aceito na ortodoxia 
científica mas, frequentemente, é utilizado no dia a dia do trabalho 
científico. No contexto de um programa, muitas vezes somos força- 
dos a lidar com possibilidades de erros e precisamos de ferramentas 
para lidar com eles. 

Muitas vezes queremos apenas continuar nossa análise, mesmo 
quando certos erros de menor importância ocorrem; outras vezes, 
o erro é justamente o que nos interessa, pois nos permite examinar 
casos particulares onde nossa lógica não se aplica. 

Como de costume o Python nos oferece ferramentas bastante 


intuitivas para interação com erros”. 


Listagem 1.38: Exemplo de uma exceção 
1 >>> 1/0 





9Os erros tratados nesta seção não são erros de sintaxe mas erros que 
ocorrem durante a execução de programas sintaticamente corretos. Estes erros 
serão denomidados exceções 
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2 Traceback (most recent call last): 

3 File "<stdin>", line 1, in ? 

4 ZeroDivisionError: integer division or 
modulo by zero 


Suponhamos que você escreva um programa que realiza divisões 
em algum ponto, e dependendo dos dados fornecidos ao programa, 
o denominador torna-se zero. Como a divisão por zero não é possi- 
vel, o seu programa para, retornando uma mensagem similar a da 
listagem 1.38. Caso você queira continuar com a execução do pro- 
grama apesar do erro, poderíamos solucionar o problema conforme 
o exposto na listagem 1.39 


Listagem 1.39: Contornando uma divisão por zero 


1 >>> for i in range(5): 


Oy pas try: 
a. dk q=1./i 
e's eae print q 


except ZeroDivisionError: 
print "Divisão por zero!" 


on 


Divisão por zero! 
1.0 

10 0.5 

1 0.333333333333 

12 0.25 


o o q Q 


A construção try: ...except: nos permite verificar a ocorrén- 
cia de erros em partes de nossos programas e responder adequa- 
damente a ele. o Python reconhece um grande número de tipos 
de exceções, chamadas “built-in exceptions”. Mas não precisamos 
sabê-las de cor, basta causar o erro e anotar o seu nome. 
Certas situações podem estar sujeitas à ocorrência de mais de 
um tipo de erro. neste caso, podemos passar uma tupla de exceções 
para a palavra-chave except: except (NameError, ValueError,IDError) :pass, 
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ou simplesmente nao passar nada: except: pass. Pode aconte- 
cer ainda que queiramos lidar de forma diferente com cada tipo de 
erro (listagem 1.40). 


Listagem 1.40: Lidando com diferentes tipos de erros. 


1 >>> try: 

2 f = open(’arq.txt’) 

3 s = f.readline() 

4 i = int(s.strip()) 

5 except IOError, (errno, strerror): 

6 print "Erro de I/O (%s): %s" % ( 
errno, strerror) 

7 except ValueError: 

8 print "Nao foi possivel converter o 
dado em Inteiro." 

9 except: 

10 print "Erro desconhecido." 

A construção try:...except: acomoda ainda uma cláusula 


else opcional, que será executada sempre que o erro esperado não 
ocorrer, ou seja, caso ocorra um erro imprevisto a cláusula else 
será executada (ao contrário de linhas adicionais dentro da cláusula 
try). 

Finalmente, try permite uma outra cláusula opcional, finally, 
que é sempre executada (quer haja erros quer não). Ela é util para 
tarefas que precisam ser executadas de qualquer forma, como fechar 
arquivos ou conexões de rede. 


1.6 Funções 


No Python, uma função é um bloco de código definido por um 
cabeçalho específico e um conjunto de linhas indentadas, abaixo 
deste. Funções, uma vez definidas, podem ser chamadas de qual- 
quer ponto do programa (desde que pertençam ao espaço de no- 
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mes). Na verdade, uma diferença fundamental entre uma função e 
outros objetos é o fato de ser “chamável”. Isto decorre do fato de to- 
das as funções possuirem um método!º chamado . call... Todos 
os objetos que possuam este método poderão ser chamados!!. 

O ato de chamar um objeto, em Python, é caracterizado pela 
aposição de parênteses ao nome do objeto. Por exemplo: func(). 
Estes parênteses podem ou não conter “argumentos”. Continue 
lendo para uma explicação do que são argumentos. 

Funções também possuem seu próprio espaço de nomes, ou seja, 
todas as variáveis definidas no escopo de uma função só existem 
dentro desta. Funções são definidas pelo seguinte cabeçalho: 


1 def nome(parl, par2, par3=valordefault , x 
args, **xkwargs): 


A palavra reservada def indica a definição de uma função; em 
seguida deve vir o nome da função que deve seguir as regras de 
formação de qualquer nome em Python. Entre parênteses vem, 
opcionalmente, uma lista de argumentos que serao ser passados 
para a função quando ela for chamada. Argumentos podem ter 
valores “default” se listados da forma a=1. Argumentos com valores 
default devem vir necessariamente após todos os argumentos sem 
valores default (Listagem 1.41). 


Listagem 1.41: Definindo uma função com um argumento obriga- 
tório e outro opcional (com valor “default"). 

1 >>> def fun(a,b=1): 

2 print a,b 
3 ra rá 

4 >>> fun (2) 

5 21 





10Veja o capítulo 2 para uma explicação do que são métodos. 

HO leitor, neste ponto deve estar imaginando todo tipo de coisas inte- 
ressantes que podem advir de se adicionar um método . call. a objetos 
normalmente não “chamáveis”. 
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>>> fun (2,3) 

23 

fun (b=5,2) 

SyntaxError: non—keyword arg after keyword 
arg 


o © N Q 


Por fim, um número variável de argumentos adicionais pode ser 
previsto através de argumentos precedidos por * ou **. No exemplo 
acima, argumentos passados anonimamente (não associados a um 
nome) serão colocados em uma tupla de nome t, e argumentos 
passados de forma nominal (z=2,q=’asd’)serao adicionados a um 
dicionário, chamado d(Listagem 1.42). 


Listagem 1.42: lista de argumentos variável 


>>> def fun(xt, **d): 
print t, d 

>>> fun(1,2,c=2,d=4) 

(1,2) {’c’:3,’d’:4} 


e wo e 


Funções são chamadas conforme ilustrado na linha 3 da listagem 
1.42. Argumentos obrigatórios, sem valor “default”, devem ser pas- 
sados primeiro. Argumentos opcionais podem ser passados fora de 
ordem, desde que após os argumentos obrigatórios, que serão atri- 
buídos sequencialmente aos primeiros nomes da lista definida no 
cabeçalho da função(Listagem 1.41). 

Muitas vezes é conveniente “desempacotar” os argumentos pas- 
sados para uma função a partir de uma tupla ou dicionário. 


Listagem 1.43: Desempacotando argumentos. 
1 >>> def fun(a,b,c,d): 
2 print a,b,c,d 
3 >>> t=(1,2);di = {’d’: 3, ’c’: 4} 
4 >>> fun(«t,**di) 
5 12 4 3 
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Argumentos passados dentro de um dicionário podem ser utili- 
zados simultâneamente para argumentos de passagem obrigatória 
(declarados no cabeçalho da função sem valor “default” e para ar- 
gumentos opcionais, declarados ou não(Listagem 1.44). 


Listagem 1.44: Passando todos os argumentos por meio de um 
dicionário. 
>>> def fun2(a, b=1,*xoutros): 
print a, b, outros 


>>> fun2(«* dic) 


1 
2 
3 eee 
4 >>> dic = {’a’:1,’b’:2,’c’:3,7°d’:4} 
5 
6 12 {’c’: 3, ’d’: 4} 


Note que no exemplo 1.44, os valores cujas chaves correspon- 
dem a argumentos declarados, são atribuídos a estes e retirados do 
dicionário, que fica apenas com os ítens restantes. 

Funções podem retornar valores por meio da palavra reservada 
return. 


Listagem 1.45: Retornando valores a partir de uma função. 


1 >>> def soma(a,b): 

2 return atb 

3 print "ignorado!" 
4 >>> soma (3,4) 

5 7 


A palavra return indica saída imediata do bloco da função le- 
vando consigo o resultado da expressão à sua direita. 
Funções lambda 


Funções lambda são pequenas funções anônimas que podem ser 
definidas em apenas uma linha. Por definição, podem conter uma 
única expressão. 


38 CAPITULO 1. FUNDAMENTOS DA LINGUAGEM 


Listagem 1.46: Funções lambda 

1 >>> def raiz(n):#definindo uma raiz de ordem 
n 

2 return lambda(x) :x**(1./n) 

3 >>> r4 = raiz(4)#r4 calcula a raiz de ordem 
4 

4 >>> r4(16) #utilizando 

5 2 


Observe no exemplo (1.46), que lambda lembra a definição de 
variáveis do espaço de nome em que foi criada. Assim, r4 passa 
a ser uma função que calcula a raiz quarta de um número. Este 
exemplo nos mostra que podemos modificar o funcionamento de 
uma função durante a execução do programa: a função raiz retorna 
uma função raiz de qualquer ordem, dependendo do argumento que 
receba. 


Geradores 


Geradores são um tipo especial de função que retém o seu estado 
de uma chamada para outra. São muito convenientes para criar 
iteradores, ou seja, objetos que possuem o método next (). 


Listagem 1.47: Geradores 


1 >>> def letras (palavra): 

2 for i in palavra: 

3 yield i 

4 >>> for L in letras(’gato’): print L 
5 g 

6 a 

7 4 

8 O 


Como vemos na listagem 1.47 um gerador é uma função sobre 
a qual podemos iterar. 
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Decoradores 


Decoradores são uma alteração da sintaxe do Python, introdu- 
zida a partir da versão 2.4, para facilitar a modificação de funções 
(sem alterá-las), adicionando funcionalidade. Nesta seção vamos 
ilustrar o uso básico de decoradores. Usos mais avançados po- 
dem ser encontrados nesta url: http: //wiki.python.org/moin/ 
PythonDecoratorLibrary. 


ot oun Fw NY Hm 





Listagem 1.48: Decorador básico. 





def faznada(f): 





def novaf(xargs,*xkwargs): 





print "chamando..." args ,kwargs 
return f(xargs,*+kwargs) 

novaf. name = f. _ name 

novaf. doc = f. do 





novaf.  dict | .update(f. dit ) 
return novaf 











Na listagem 1.48, vemos um decorador muito simples. Como 


seu nome diz, não faz nada, além de ilustrar a mecânica de um de- 
corador. Decoradores esperam um único argumento: uma função. 
A listagem 1.49, nos mostra como utilizar o decorador. 


Listagem 1.49: Utilizando um decorador 


>>> @faznada 


def soma(a,b): 
return a+b 


>>> soma(1,2) 
chamando... (1, 2) {} 
Out [5]:3 


O decorador da listagem 1.48, na verdade adiciona uma linha 
código à função que decora: print "chamando..." args,kwargs. 
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Repare que o decorador da listagem 1.48, passa alguns atribu- 
tos básicos da função original para a nova função, de forma que 
a função decorada possua o mesmo nome, docstring, etc. que a 
funçao original. No entanto, esta passagem de atributos “polui” 
o código da função decoradora. Podemos evitar a “poluição e o 
trabalho extra utilizando a funcionalidade do módulo functools. 


Listagem 1.50: Limpando a geração de decoradores 


1 >>> from functools import wraps 
2 >>> def meuDecorador(f): 


3 fis @wraps(f) 

4 hed def novaf(*args , **xkwds): 

5 is print "Chamando funcao 
decorada ’ 

6 return f(xargs, **kwds) 

7 return novaf 

8 TE 

9 >>> @meuDecorador 

10 ... def exemplo(): 

11 Sieh """ Docstring""" 

12 ud print "funcao exemplo 
executada!” 

13 partie) 

14 >>> exemplo() 

15 Chamando funcao decorada 

16 funcao exemplo executada! 

17 >>> exemplo. name __ 

18 “exemplo 

19 >>> exemplo. doc | 

20 ’Docstring ’ 


Decoradores nao adicionam nenhuma funcionalidade nova ao 
que já é possível fazer com funções, mas ajudam a organizar o 
código e reduzir a necessidade duplicação. Aplicações científicas 
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de decoradores são raras, mas a sua presença em pacotes e módu- 
los de utilização genérica vem se tornando cada vez mais comum. 
Portanto, familiaridade com sua sintaxe é aconselhada. 


Strings de Documentação 


Strings posicionadas na primeira linha de uma função, ou seja, 
diretamente abaixo do cabeçalho, são denominadas strings de do- 
cumentação, ou simplesmente docstrings. 

Estas strings devem ser utilizadas para documentar a função 
explicitando sua funcionalidade e seus argumentos. O conteúdo de 
uma docstring está disponível no atributo _.doc__ da função. 

Ferramentas de documentação de programas em Python ex- 
traem estas strings para montar uma documentação automática 
de um programa. A função help(nome da função) também re- 
torna a docstring. Portanto a inclusão de docstrings auxilia tanto 
o programador quanto o usuário. 


Listagem 1.51: Usando Docstrings 


1 >>> def soma(a,b): 
"uN 


Esta funcao soma dois numeros: 


3 

4 >>> soma(2,3) 

5 5 

6 meee 

7 return a+b 

s >>> help (soma) 

ə Help on function soma in module __ main _ 


1 soma(a, b) 

12 Esta funcao soma dois numeros: 
13 >>> soma (2,3) 

14 5 
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No exemplo 1.51, adicionamos uma docstring explicando a fina- 
lidade da função soma e ainda incluímos um exemplo. Incluir um 
exemplo de uso da função cortado e colado diretamente do console 
Python (incluindo o resultado), nos permitirá utilizar o módulo 
doctest para testar funções, como veremos mais adiante. 


1.7 Módulos e Pacotes 


Para escrever programas de maior porte ou agregar coleções de 
funções e/ou objetos criados pelo usuário, o código Python pode 
ser escrito em um arquivo de texto, salvo com a terminação .py, 
facilitando a re-utilização daquele código. Arquivos com código 
Python contruídos para serem importados, são denominados “mó- 
dulo”. Existem algumas variações na forma de se importar módu- 
los. O comando import meumodulo cria no espaço de nomes um 
objeto com o mesmo nome do módulo importado. Funções, classes 
(ver capítulo 2) e variáveis definidas no módulo são acessíveis como 
atributos deste objeto. O comando from modulo import * im- 
porta todas as funções e classes definidas pelo módulo diretamente 
para o espaço de nomes global!” do nosso script. Deve ser utilizado 
com cuidado pois nomes iguais pré-existentes no espaço de nomes 
global serão redefinidos. Para evitar este risco, podemos substituir 
o * por uma sequência de nomes correspondente aos objetos que 
desejamos importar: from modulo import nome1, nome2. Pode- 
mos ainda renomear um objeto ao importá-lo: import numpy as 
Nou ainda from numpy import det as D. 

Seja um pequeno módulo como o do exemplo 1.52. Podemos 
importar este módulo em uma sessão do interpretador iniciada no 
mesmo diretório que contém o módulo (exemplo 1.7). 


1 >>> import fibo 





"Dicionário de nomes de variáveis e funções válidos durante a execução de 
um script 
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Listagem 1.52: Módulo exemplo 





Hm 


# Disponvel no pacote de programas como: 
fibo .py 

#modulo para calcular a serie de fibonacci 
ate o numero n. 


N 


def fib(n): 
a, b=0, 1 
while b < n: 
print b, 
a, b = b, a+b 


O o q Oo na A WwW 


10|| if name ==" main ": 

11 import sys 

12 print __name _ 

13 print sys.argv 

14 fib (int (sys.argv[1]) ) 




















2 >>> fibo. fib (50) 

3 1123 5 8 13 21 34 

4 >>> fibo. _ name _ 
5 ’fibo’ 

Note que a função declarada em fibo.py é chamada como um 
método de fibo. Isto é porque módulos importados são objetos 
(como tudo o mais em Python). 

Quando um módulo é importado ou executado diretamente , 
torna-se um objeto com um atributo __name__. O conteúdo deste 
atributo depende de como o módulo foi executado. Se foi executado 
por meio de importação, __name__ é igual ao nome do módulo 
(sem a terminação “.py”). Se foi executado diretamente (python 
modulo.py), __name__ é igual a ‘‘__main__’’. 
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Durante a importação de um módulo, todo o código contido no 
mesmo é executado, entretanto como o __name__ de fibo é “fibo” 
e nao “ main *?, as linhas abaixo do if não são executadas. 
Qual então a função destas linhas de código? Módulos podem ser 
executados diretamente pelo interpretador, sem serem importados 
primeiro. Vejamos isso no exemplo 1.53. Podemos ver que agora 
o __name__ do módulo é “ main * e, portanto, as linhas de 
código dentro do bloco if são executadas. Note que neste caso 
importamos o módulo sys, cujo atributo argv nos retorna uma 
lista com os argumentos passados para o módulo a partir da posição 
1. A posição 0 é sempre o nome do módulo. 


Listagem 1.53: Executing a module from the console. 
$ python fibo.py 60 


ts °60’| 
1123 5 8 13 21 34 55 


» won mn 
E 
o 
© 
ES) 
Sa 


Qualquer arquivo com terminação .py é considerado um mó- 
dulo Python pelo interpretador Python. Módulos podem ser exe- 
cutados diretamente ou “importados” por outros módulos. 

A linguagem Python tem como uma de suas principais vanta- 
gens uma biblioteca bastante ampla de módulos, incluída com a 
distribuição básica da linguagem. Nesta seção vamos explorar al- 
guns módulos da biblioteca padrão do Python, assim como outros, 
módulos que podem ser obtidos e adicionados à sua instalação do 
Python. 

Para simplicidade de distribuição e utilização, módulos podem 
ser agrupados em “pacotes”. Um pacote nada mais é do que um 
diretório contendo um arquivo denominado __init__.py (este ar- 
quivo não precisa conter nada). Portanto, pode-se criar um pacote 
simplesmente criando um diretório chamado, por exemplo, “pacote” 
contendo os seguintes módulos: modulo1.py e modulo2.py!®. Um 





13 Além de __init__.py, naturalmente. 
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pacote pode conter um número arbitrário de módulos, assim como 
outros pacotes. 

Como tudo o mais em Python, um pacote também é um objeto. 
Portanto, ao importar o pacote “pacote” em uma sessão Python, 
modulol e modulo2 aparecerão como seus atributos (listagem 1.54). 


Listagem 1.54: importing a package 
1 >>> import pacote 


2 >>> dir(pacote) 
3 [’modulol’ ,’modulo2’ | 


Pacotes Úteis para Computação Científica 
Numpy 


Um dos pacotes mais importantes, senão o mais importante para 
quem deseja utilizar o Python em computação científica, é o numpy. 
Este pacote contém uma grande variedade de módulos voltados 
para resolução de problemas numéricos de forma eficiente. 

Exemplos de objetos e funções pertencentes ao pacote numpy 
aparecerão regularmente na maioria dos exemplos deste livro. Uma 
lista extensiva de exemplos de Utilização do Numpy pode ser con- 
sultada neste endereço: http://www.scipy.org/Numpy Example. 
List 

Na listagem 1.55, vemos um exemplo de uso típico do numpy. O 
numpy nos oferece um objeto matriz, que visa representar o conceito 
matemático de matriz. Operações matriciais derivadas da algebra 
linear, são ainda oferecidas como funções através do subpacote li- 
nalg (Listagem 1.55). 


Listagem 1.55: Calculando e mostrando o determinante de uma 
matriz. 

1 >>> from numpy import x 

2 >>> a = arange (9) 
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>>> print a 
[01234567 8] 
>>> a.shape =(3,3) 
>>> print a 

[[0 1 2] 

[3 4 5] 

[6 7 8]] 
10 >>> from numpy.linalg import det 
u >>> det(a) 
12 0.0 
13 >>> 


o o | Dot A U 


Na primeira linha do exemplo 1.55, importamos todas as fun- 
ções e classes definidas no módulo numpy. 

Na segunda linha, usamos o comando arange(9) para criar 
um vetor a de 9 elementos. Este comando é equivalente ao range 
para criar listas, só que retorna um vetor (matriz unidimensional). 
Note que este vetor é composto de números inteiros sucessivos co- 
meçando em zero. Todas as enumerações em Python começam 
em zero. Como em uma lista, a [0] é o primeiro elemento do ve- 
tor a. O objeto que criamos, é do tipo array, definido no mó- 
dulo numpy. Uma outra forma de criar o mesmo objeto seria: a = 
array([0,1,2,3,4,5,6,7,8]). 

Na terceira linha, nós mostramos o conteúdo da variável a com 
o comando print. Este comando imprime na tela o valor de uma 
variável. 

Como tudo em Python é um objeto, o objeto array apresenta 
diversos métodos e atributos. O atributo chamado shape contém o 
formato da matriz como uma tupla, que pode ser multi-dimensional 
ou não. Portanto, para converter vetor a em uma matriz 3x3, basta 
atribuir o valor (3,3) a shape. Conforme já vimos, atributos e 
métodos de objetos são referenciados usando-se esta notação de 
ponto!*. 





nome da variável.atributo 
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Na quinta linha, usamos o comando print para mostrar a al- 
teração na forma da variável a. 

Na sexta linha importamos a função det do módulo numpy. linalg 
para calcular o determinante da nossa matriz. A função det(a) nos 
informa, então, que o determinante da matriz a é 0.0. 


Scipy 


Outro módulo muito útil para quem faz computação numérica com 
Python, é o scipy. O scipy depende do numpy e provê uma 
grande coleção de rotinas numéricas voltadas para aplicações em 
matemática, engenharia e estatística. 

Diversos exemplos da segunda parte deste livro se utilizarão 
do scipy, portanto, não nos extenderemos em exemplos de uso do 
scipy. 

Uma lista extensa de exemplos de utilização do scipy pode ser 
encontrada no seguinte endereço:nttp: //www.scipy .org/Documentation. 


1.8 Documentando Programas 


Parte importante de um bom estilo de trabalho em computação ci- 
entífica é a documentação do código produzido. Apesar do Python 
ser uma linguagem bastante clara e de fácil leitura por humanos, 
uma boa dose de documentação é sempre positiva. 

O Python facilita muito a tarefa tanto do documentador quanto 
do usuário da documentação de um programa. Naturalmente, o 
trabalho de documentar o código deve ser feito pelo programador, 
mas todo o resto é feito pela própria linguagem. 

A principal maneira de documentar programas em Python é 
através da adição de strings de documentação (“docstrings” a fun- 
ções e classes ao redigir o código. Módulos também podem possuir 
“docstrings” contendo uma sinopse da sua funcionalidade. Estas 
strings servem não somente como referência para o próprio progra- 
mador durante o desenvolvimento, como também como material 
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para ferramentas de documentação automática. A principal ferra- 
menta de documentação disponível para desenvolvedores é o pydoc, 
que vem junto com a distribuição da linguagem. 


Pydoc 


O pydoc é uma ferramenta que extrai e formata a documentação 
de programas Python. Ela pode ser utilizada de dentro do console 
do interpretador Python, ou diretamente do console do Linux. 


1 $ pydoc pydoc 


No exemplo acima, utilizamos o pydoc para examinar a documen- 
tação do próprio módulo pydoc. Podemos fazer o mesmo para 
acessar qualquer módulo disponível no PYTHONPATH. 

O pydoc possui algumas opções de comando muito úteis: 


-k <palavra> Procura por palavras na documentação de todos 
os módulos. 


-p <porta> <nome> Gera a documentação em html iniciando 
um servidor HTTP na porta especificada da máquina local. 


-g Util para sistemas sem fácil acesso ao console, inicia um servidor 
HTTP e abre uma pequena janela para busca. 


-w <nome> escreve a documentação requisitada em formato HTML, 
no arquivo <nome>.html, onde <nome> pode ser um módulo 
instalado na biblioteca local do Python ou um módulo ou pa- 
cote em outra parte do sistema de arquivos. Muito útil para 
gerar documentação para programas que criamos. 


Além do pydoc, outras ferramentas mais sofisticadas, desen- 
volvidas por terceiros, estão disponíveis para automatizar a docu- 
mentação de programas Python. Exploraremos uma alternativa a 
seguir. 
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Epydoc 


O Epydoc é uma ferramenta consideravelmente mais sofisticada do 
que o módulos pydoc. Além de prover a funcionalidade já demon- 
trada para o pydoc, oferece outras facilidades como a geração da 
documentação em formato PDF ou HTML e suporte à formatação das 
“docstrings”. 

O uso do Epydoc é similar ao do pydoc. Entretanto, devido 
à sua maior versatilidade, suas opções são bem mais numerosas 
(1.56). 


Listagem 1.56: Listando as opções do Epydoc. 
1 $ epydoc —h 


Não vamos discutir em detalhes as várias opções do Epydoc 
pois estas encontram-se bem descritas na página man do programa. 
Ainda assim, vamos comentar algumas funcionalidades interessan- 
tes. 

A capacidade de gerar a documentação em FTRX, facilita a 
customização da mesma pelo usuário e a exportação para outros 
formatos. A opção -url, nos permite adicionar um link para o 
website de nosso projeto ao cabeçalho da documentação. O Epydoc 
também verifica o quão bem nosso programa ou pacote encontra- 
se documentado. Usando-se a opção -check somos avisados sobre 
todos os objetos não documentados. 

A partir da versão 3.0, o Epydoc adiciona links para o código 
fonte na íntegra, de cada elemento de nosso módulo ou pacote. A 
opção -graph pode gerar três tipos de gráficos sobre nosso pro- 
grama, incluindo um diagrama UML(Figura 1.1). 


Dada toda esta funcionalidade, vale apena conferir o Epydoc!®. 





l5http://epydoc. sourceforge.net 
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API Documentation - Konqueror 
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Figura 1.1: Versão HTML da documentação gerada pelo Epydoc. 


1.9 Exercícios 


1. Repita a iteração do exemplo 1.35 sem utilizar a função enu- 
merate. Execute a iteração do objeto gerado por enumerate 
manualmente, sem o auxílio do laço for e observe o seu re- 


sultado. 


2. Adicione a funcionalidade else à listagem 1.33 utilizando 


exceções. 


3. Escreva um exemplo de iteração empregando break, continue 
e else(ao final). 


Capitulo 2 


Programacao Orientada a 
Objetos 


Introdução à programação orientada a objetos e sua im- 
plementação na linguagem Python. Pré-requisitos: 
Ter lido o capítulo 1. 


ROGRAMAÇÃO orientada a objetos é um tema vasto na litera- 

tura computacional. Neste capítulo introduziremos os recur- 

sos presentes na linguagem Python para criar objetos e, através de 

exemplos, nos familiarizaremos com o paradigma da programação 
orientada a objetos. 

Historicamente, a elaboração de programas de computador pas- 
sou por diversos paradigmas. Programas de computador começa- 
ram como uma simples lista de instruções a serem executadas, em 
sequência, pela CPU. Este paradigma de programação foi mais 
tarde denominado de programação não-estruturada. Sua principal 
característica é a presença de comandos para desviar a execução 
para pontos específicos do programa (goto, jump, etc.) Exem- 
plos de linguagens não-estruturadas são Basic, Assembly e Fortran. 
Mais tarde surgiram as linguagens estruturadas, que permitiam a 
organização do programa em blocos que podiam ser executados em 
qualquer ordem. As Linguagens C e Pascal ganham grande popu- 
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laridade, e linguagens até então não estruturadas (Basic, Fortran, 
etc.) ganham versões estruturadas. Outros exemplos de lingua- 
gens não estruturadas incluem Ada, D, Forth,PL/1, Perl, maple, 
Matlab, Mathematica, etc. 

A estruturação de programas deu origem a diversos paradig- 
mas de programação, tais como a programação funcional, na qual 
a computação é vista como a avaliação sequencial de funções mate- 
máticas, e cujos principais exemplos atuais são as linguagens Lisp 
e Haskell. 

A programação estruturada atingiu seu pico em versatilidade e 
popularidade com o paradigma da programação orientada a obje- 
tos. Na programação orientada a objetos, o programa é dividido 
em unidades (objetos) contendo dados (estado) e funcionalidade 
(métodos) própria. Objetos são capazes de receber mensagens, 
processar dados (de acordo com seus métodos) e enviar mensagens 
a outros objetos. Cada objeto pode ser visto como uma máquina 
independente ou um ator que desempenha um papel específico. 


2.1 Objetos 


Um tema frequente em computação científica, é a simulação de 
sistemas naturais de vários tipos, físicos, químicos, biológicos, etc. 
A orientação a objetos é uma ferramenta natural na construção de 
simulações, pois nos permite replicar a arquitetura do sistema natu- 
ral em nossos programas, representando componentes de sistemas 
naturais como objetos computacionais. 

A orientação a objeto pode ser compreendida em analogia ao 
conceito gramatical de objeto. Os componentes principais de uma 
frase são: sujeito, verbo e objeto. Na programação orientada a 
objeto, a ação está sempre associada ao objeto e não ao sujeito, 
como em outros paradigmas de programação. 

Um dos pontos altos da linguagem Python que facilita sua assi- 
milação por cientistas com experiência prévia em outras linguagens 
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Listagem 2.1: Definindo uma classe 





class Objeto: 
2 pass 


=. 














de programação, é que a linguagem não impõe nenhum estilo de 
programação ao usuário. Em Python pode-se programar de forma 
não estruturada, estruturada, procedural, funcional ou orientada a 
objeto. Além de acomodar as preferências de cada usuário, per- 
mite acomodar as conveniências do problema a ser resolvido pelo 
programa. 

Neste capítulo, introduziremos as técnicas básicas de progra- 
mação orientada a objetos em Python. Em exemplos de outros 
capítulos, outros estilos de programação aparecerão, justificados 
pelo tipo de aplicação a que se propõe. 


Definindo Objetos e seus Atributos em Python 


Ao se construir um modelo de um sistema natural, uma das carac- 
terísticas desejáveis deste modelo, é um certo grau de generalidade. 
Por exemplo, ao construir um modelo computacional de um auto- 
móvel, desejamos que ele (o modelo) represente uma categoria de 
automóveis e não apenas nosso automóvel particular. Ao mesmo 
tempo, queremos ser capazes de ajustar este modelo para que ele 
possa representar nosso automóvel ou o de nosso vizinho sem pre- 
cisar re-escrever o modelo inteiramente do zero. A estes modelos 
de objetos dá-se o nome de classes. 

A definição de classes em Python pode ser feita de forma mais 
ou menos genérica. À partir das classes, podemos construir instân- 
cias ajustadas para representar exemplares específicos de objetos 
representados pela classe. Na listagem 2.1, temos uma definição 
mínima de uma classe de objetos. Criamos uma classe chamada 
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Listagem 2.2: Definindo atributos de uma classe 





ij class pessoa: 

2 idade=20 

3 altura=170 

4 sexo=’masculino’ 
5 peso=70 














Objeto, inteiramente em branco. Como uma classe completamente 
vazia não é possível em Python, adicionamos o comando pass que 
não tem qualquer efeito. 

Para criar uma classe mais útil de objetos, precisamos definir 
alguns de seus atributos. Como exemplo vamos criar uma classe 
que represente pessoas. Na listagem 2.2, definimos alguns atribu- 
tos para a classe pessoa. Agora, podemos criar instâncias do objeto 
pessoa e estas instâncias herdarão estes atributos. 


1 >>> maria = pessoa () 

>>> maria. peso 

70 

>>> maria.sexo 

5 “masculino 

6 >>> maria 

7 <__main__. pessoa instance at 0x402f196c> 


e WwW N 


Entretanto, os atributos definidos para o objeto pessoa (listagem 
2.2), são atributos que não se espera que permaneçam os mesmos 
para todas as possíveis instâncias (pessoas). O mais comum é que 
os atributos específicos das instâncias sejam fornecidos no momento 
da sua criação. Para isso, podemos definir quais as informações 
necessárias para criar uma instância do objeto pessoa. 


Listagem 2.3: Passando atributos na criação de um objeto 
1 >>> class pessoa: 
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By ats def _ init__(self ,idade ,altura , sexo, 
peso): 

3 self .idade=idade 

4 self. altura=altura 

5 self .sexo=sexo 

Elas self. peso=70 

7 >>> maria = pessoa() 

s Traceback (most recent call last): 

9 File "<stdin>", line 1, in ? 


10 TypeError: __init__() takes exactly 5 
arguments (1 given) 

1 maria=pessoa(35,155,’feminino’ ,50) 

12 >>> maria. sexo 

13 "feminino 


A função __init__ que definimos na nova versão da classe pessoa 
(listagem 2.3), é uma função padrão de classes, que é executada 
automaticamente, sempre que uma nova instância é criada. Assim, 
se não passarmos as informações requeridas como argumentos pela 
função __init__ (listagem 2.3, linha 7), recebemos uma mensagem 
de erro. Na linha 11 da listagem 2.3 vemos como instanciar a nova 
versão da classe pessoa. 


Adicionando Funcionalidade a Objetos 


Continuando com a analogia com objetos reais, os objetos computa- 
cionais também podem possuir funcionalidades, além de atributos. 
Estas funcionalidades são denominadas métodos de objeto. Méto- 
dos são definidos como funções pertencentes ao objeto. A função 
__init__ que vimos há pouco é um método presente em todos os 
objetos, ainda que não seja definida pelo programador. Métodos 
são sempre definidos com, pelo menos, um argumento: self, que 
pode ser omitido ao se invocar o método em uma instância do ob- 
jeto (veja linha 11 da listagem 2.3). O argumento self também 
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deve ser o primeiro argumento a ser declarado na lista de argumen- 
tos de um método. 


Herança 


Para simplificar a definição de classes complexas, classes podem 
herdar atributos e métodos de outras classes. Por exemplo, uma 
classe Felino, poderia herdar de uma classe mamífero, que por sua 
vez herdaria de outra classe, vertebrados. Esta cadeia de herança 
pode ser extendida, conforme necessário (Listagem 2.4). 


Listagem 2.4: Herança 
>>> class Vertebrado: 


1 

2 vertebra = True 

3 >>> class Mamifero( Vertebrado): 

4 mamas = True 

5 >>> class Carnivoro(Mamifero) : 

6 longos caninos = True 

7 >>> bicho = Carnivoro() 

s >>> dir(bicho) 

ə [” doc *, * module >, “longos caninos”, 





“mamas”, ’vertebra’| 
10 >>> issubclass (Carnivoro, Vertebrado) 
1 True 


12 >>> bicho. class __ 

13 <class — main | .Carnivoro at Oxb7ald1l7c> 
14 >>> isinstance (bicho, Mamifero) 

15 True 


Na listagem 2.4, vemos um exemplo de criação de um objeto, 
instância da classe Carnivoro, herdando os atributos dos ancestrais 
desta. Vemos também que é possivel testar a pertinência de um 
objeto a uma dada classe, através da função isinstance. À função 
issubclass, de forma análoga, nos permite verificar as relações 
parentais de duas classes. 
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Utilizando Classes como Estruturas de Dados 
Genéricas. 


` 


Devido à natureza dinâmica do Python, podemos utilizar uma 
classe como um compartimento para quaisquer tipos de dados. Tal 
construto seria equivalente ao tipo struct da linguagem C. Para 
exemplificar, vamos definir uma classe vazia: 


Listagem 2.5: Classe como uma estrura de dados 
1 >>> class Cachorro: 


2 pass 
3 >>> rex=Cachorro() 

4 >>> rex. dono = ’Pedro’ 
5 >>> rex.raca = ’Pastor’ 
6 >>> rex. peso=25 

7 >>> rex.dono 

s ’Pedro’ 

9 >>> laika = Cachorro() 


10 >>> laika.dono 
1 AttributeError: Cachorro instance has no 
attribute ’dono’ 


A 


No exemplo 2.5, a classe Cachorro é criada vazia, mas ainda 
assim, atributos podem ser atribuidos a suas instâncias, sem alterar 
a estrutura da classe. 


2.2 Exercícios 


1. Utilizando os conceitos de herança e os exemplos de classes 
apresentados, construa uma classe Cachorro que herde atri- 
butos das classes Carnivoro e Mamifero e crie instâncias que 
possuam donos, raças, etc. 


2. No Python, o que define um objeto como “chamável” (funções, 
por exemplo) é a presença do método . call... Crie uma 
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classe, cujas instâncias podem ser “chamadas”, por possuírem 
o método . call... 


Capitulo 3 


Criando Gráficos em Python 


Introdução à produção de figuras de alta qualidade uti- 
lizando o pacote matplotlib. Pré-requisitos: Capitulo 
1. 


XISTE um número crescente de módulos para a criação de grá- 

ficos científicos com Python. Entretanto, até o momento da 

publicação deste livro, nenhum deles fazia parte da distribuição 
oficial do Python. 

Para manter este livro prático e conciso, foi necessário escolher 
apenas um dos módulos de gráficos disponíveis, para apresentação 
neste capítulo. 

O critério de escolha levou em consideração os principais valores 
da filosofia da linguagem Python (ver listagem ): simplicidade, 
elegância, versatilidade, etc. À época, a aplicação destes critérios 
nos deixou apenas uma opção: o módulo matplotlib!. 


3.1 Introdução ao Matplotlib 


O módulo matplotlib (MPL) é voltado para a geração de gráficos 
bi-dimensionais de vários tipos, e se presta para utilização tanto in- 





Thttp://matplotlib.sourceforge.net 
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terativa quanto em scripts, aplicações web ou integrada a interfaces 
gráficas (GUIs) de vários tipos. 

A instalação do MPL também segue o padrão de simplicidade 
do Python (listagem 3.1). Basta baixar o pacote tar.gz do sítio, 
descompactar e executar o comando de instalação. 


Listagem 3.1: Instalando o matplotlib 
1 $ python setup.py install 


O MPL procura tornar simples tarefas de plotagem, simples e 
tarefas complexas, possíveis (listagem3.2, figura 3.1). Os gráficos 
gerados podem ser salvos em diversos formatos: jpg, png, ps, eps e 
svg. Ou seja, o MPL exporta em formatos raster e vetoriais (svg) 
o que torna sua saída adequada para inserção em diversos tipos de 
documentos. 


Listagem 3.2: Criando um histograma no modo interativo 


>>> from pylab import x 

>>> from numpy.random import x 
>>> x-normal(0,1,1000) 

>>> hist (x,30) 


a an F Ù N e 


>>> show () 

Podemos também embutir a saída gráfica do MPL em diver- 
sas GUIs: GTK, WX e TKinter. Naturalmente a utilização do 
MPL dentro de uma GUI requer que os módulos adequados para 
o desenvolvimento com a GUI em questão estejam instalados”. 
Para gerar os gráficos e se integrar a interfaces gráficas, o MPL 


se utiliza de diferentes “backends” de acordo com nossa escolha 
(Wx, GTK, Tk, etc). 





2Veja no sitio do MPL os pré-requisitos para cada uma das GUIs 


3.1. INTRODUCAO AO MATPLOTLIB 61 


90 








Figura 3.1: Histograma simples a partir da listagem 3.2 


Configurando o MPL 


O MPL possui valores default para propriedades genéricas dos grá- 
ficos gerados. Estas configurações ficam em um arquivo texto 
chamado matplotlibrc, que deve ser copiado da distribuição do 
MPL, editado conforme as preferências do usuário e renomeado 
para ~/.matplotlibrc, ou seja, deve ser colocado como um ar- 
quivo oculto no diretório home do usuário. 


A utilização de configurações padrão a partir do matplotlibre 
é mais útil na utilização interativa do MPL, pois evita a necessidade 
de configurar cada figura de acordo com as nossas preferências, a 
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bar Gráfico de barras 
cohere Gráfico da função de coerência 
csd Densidade espectral cruzada 
errorbar | Gráfico com barras de erro 
hist Histograma 
imshow Plota imagens 
pcolor Gráfico de pseudocores 
plot Gráfico de linha 
psd Densidade espectral de potência 
scatter | Diagrama de espalhamento 
specgram | Espectrograma 
stem Pontos com linhas verticais 








Tabela 3.1: Principais comandos de plotagem do MPL 


cada vez que usamos o MPL?. 


Comandos Básicos 


Os comandos relacionados diretamente à geração de gráficos são 
bastante numerosos(tabela 3.1); mas, além destes, existe um outro 
conjunto ainda maior de comandos, voltados para o ajuste fino de 
detalhes dos gráficos (ver tabela 3.2, para uma amostra), tais como 
tipos de linha, símbolos, cores, etc. Uma explicação mais detalhada 
dos comandos apresentados na tabela 3.1, será dada nas próximas 
seções no contexto de exemplos. 





3Para uma descrição completa das características de gráficos que podem 
ser configuradas, veja o ememplo de matplotlibrc que é fornecido com a 
distribuição do MPL. 


3.2. EXEMPLOS SIMPLES 


4.0 
3.5 
3.0 


2.5 


1.5 
18 0.5 1.0 1.5 2.0 2.5 3.0 


Figura 3.2: Reta simples a partir da listagem 3.3 


3.2 Exemplos Simples 


O comando plot 
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O comando plot é um comando muito versátil, pode receber um 


número variável de argumentos, com diferentes saídas. 


Listagem 3.3: Gráfico de linha 





j 


from pylab import x 
plot ([1,2,3,4]) 
show () 


N 





w 
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Quando plot recebe apenas uma sequência de números (lista, tupla 
ou array), ele gera um gráfico (listagem 3.3) utilizando os valores 
recebidos como valores de y enquanto que os valores de x são as 
posições destes valores na sequência. 

Caso duas sequências de valores sejam passadas para plot (lis- 
tagem 3.4), a primeira é atribuida a x e a segunda a y. Note que, 
neste exemplo, ilustra-se também a especificação do tipo de saída 
gráfica como uma sequência de pontos. O parâmtero ’ro’ indica 
que o símbolo a ser usado é um círculo vermelho. 


Listagem 3.4: Gráfico de pontos com valores de x e y especificados. 





from pylab import x 

plot ([1,2,3,4], [1,4,9,16], *ro’) 
axis([0, 6, 0, 20]) 
savefig(’ponto.png’) 

show () 


ao AeA BW N e 














Na linha 3 da listagem 3.4 especifica-se também os limites dos eixos 
como uma lista de quatro elementos: os valores mínimo e máximo 
dos eixos x e y, respectivamente. Na linha 4, vemos o comando 
savefig que nos permite salvar a figura gerada no arquivo cujo 
nome é dado pela string recebida. O tipo de arquivo é determinado 
pela extensão (.png, .ps, .eps, .svg, etc). 

O MPL nos permite controlar as propriedades da linha que 
forma o grafico. Existe mais de uma maneira de determinar as 
propriedades das linhas geradas pelo comando plot. Uma das 
maneiras mais diretas é através dos argumentos listados na tabela 
3.2. Nos diversos exemplos apresentados neste capitulo, alguns 
outros métodos serão apresentados e explicados‘. 

Vale a pena ressaltar que o comando plot aceita, tanto listas, 
quanto arrays dos módulos Numpy, Numeric ou numarray. Na ver- 





“Para maiores detalhes consulte a documentação do MPL 
(http://matplotlib.sourceforge.net). 
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20 


15 


10 


Figura 3.3: Gráfico com símbolos circulares a partir da listagem 
3.4 


dade todas a sequências de números passadas para o comando plot 
são convertidas internamente para arrays. 


O Comando subplot 


O MPL trabalha com o conceito de figura independente do de ei- 
gos. O comando gcef () retorna a figura atual, e o comando gca() 
retorna os eixos atuais. Este detalhe nos permite posicionar os ei- 
xos de um gráfico em posições arbitrárias dentro da figura. Todos 
os comandos de plotagem são realizados nos eixos atuais. Mas, 
para a maioria dos usuários, estes detalhes são transparentes, ou 
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Tabela 3.2: Argumentos que podem ser passados juntamente com 
a função plot para controlar propriedades de linhas. 





Propriedade Valores 

alpha transparência (0-1) 
antialiased true | false 

color Cor: b,g,r,c,m,y,k,w 

label legenda 

linestyle --: -. =- 

linewidth Espessura da linha (pontos) 
marker to.svx><7 
markeredgewidth | Espessura da margem do simbolo 
markeredgecolor | Cor da margem do simbolo 
markerfacecolor | Cor do simbolo 

markersize Tamanho do simbolo (pontos) 








seja, o usúário não precisa tomar conhecimento deles. A listagem 
3.5 apresenta uma figura com dois eixos feita de maneira bastante 
simples. 


Listagem 3.5: Figura com dois gráficos utilizando o comando sub- 
plot. 


1 


O oN De AÀ O N 


H 
© 











from pylab import x 


# Disponivel no pacote de programas como: 


subplot .py 


def f(t): 


tl 
t2 


sl = cos(2*pixt) 
el = exp(-t) 
return multiply(sl ,e1) 


arange ( 


0.0 
= arange (0.0 


, 5.0, 
5.0 





, 0.02) 


3.2. EXEMPLOS SIMPLES 
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Figura 3.4: Figura com dois gráficos utilizando o comando subplot, 
a partir da listagem 3.5 


11 


12 


13 


14 


15 


16 


17 


18 


19 








figure (1) 
subplot (211) 
plot(tl, f(tl), ’bo’, t2, f(t2), ’k’) 


subplot (212) 

plot(t2, cos(2*pixt2), ’r—’) 
savefig (’subplot.png’ ,dpi=400) 
show () 
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Tabela 3.3: Argumentos opcionais dos comandos de inserção de 
texto. 





Propriedades Valores 

alpha Transparência (0-1) 
color Cor 

fontangle italic | normal | oblique 
fontname Nome da fonte 

fontsize Tamanho da fonte 
fontweight normal | bold | light4 
horizontalalignment | left | center | right 
rotation horizontal | vertical 
verticalalignment bottom | center | top 








O comando figure(1), na linha 11 da listagem 3.5, é opcional, 
mas pode vir a ser importante quando se deseja criar múltiplas 
figuras, antes de dar o comando show(). Note pelo primeiro co- 
mando plot da listagem 3.5, que o comando plot aceita mais de 
um par (x,y), cada qual com seu tipo de linha especificado inde- 
pendentemente. 


Adicionando Texto a Gráficos 


O MPL nos oferece quatro comandos para a adição de texto a figu- 
ras: title, xlabel, ylabel, e text. O três primeiros adicionam 
título e nomes para os eixos x e y, respectivamente. 

Todos os comandos de inserção de texto aceitam argumentos 
(tabela 3.3) adicionais para formatação do texto. O MPL tam- 
bém nos permite utilizar um subconjunto da linguagem TEXpara 
formatar expressões matemáticas (Listagem 3.6 e figura 3.5. Para 
inserir expressões em TEX, é necessário que as strings contendo 
as expressões matemáticas sejam “raw strings”®, e delimitadas por 





Sexemplo: r'raw string’ 


3.3. EXEMPLOS AVANÇADOS 


cifrdes($). 


Listagem 3.6: Formatando texto e expressões matemáticas 
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pä 


# Disponivel no pacote de programas como: 
mathtext.py 

from pylab import x 

t — arange (0.0, 2.0, 0.01) 

s = sin(2*pixt) 

plot (t,s) 

title (r’$\alpha_i > \beta_i$’, fontsize=20) 

text(1, —0.6, r’$\sum_{i=O}*\infty x_i$’, 
fontsize =20) 

a], text (0.6, 0.6, r’$\cal{A}\rm{sin}(2 \omega t 

)$’, 

9 fontsize =20) 

1o/| xlabel(’time (s)’) 

nl ylabel(r ’$Voltagem (mu V)$’) 

12|| savefig (’mathtext.png’ ,dpi=400) 

13|| show () 


JN Dd ana A WB N 

















3.3 Exemplos Avançados 


O MPL é capaz produzir uma grande variedade gráficos mais so- 


fisticados do que os apresentados até agora. Explorar todas 


as 


possibilidades do MPL, foge ao escopo deste texto, mas diversos 
exemplos de outros tipos de gráficos serão apresentados junto com 


os exemplos da segunda parte deste livro. 


Mapas 


O matplotlib pode ser extendido para plotar mapas. Para isso pre- 
cisamos instalar o Basemap toolkit. Se você já instalou o matplo- 
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a> bi 





1.0 





Asin(2wt) 





0.5} 


Voltagem( pV) 
o 
o 


-0.5F 














-1-95 05 1.0 15 2.0 
time (s) 


Figura 3.5: Formatação de texto em figuras. Gerada pela listagem 
3.6 


tlib, basta baixar o arquivo tar.gz do Basemap, descompactar para 
um diretório e executar o já conhecido python setup.py install. 

O Basemap já vem com um mapa mundi incluído para demons- 
tração. Vamos utilizar este mapa em nosso exemplo (Listagem 


3.7). 


Listagem 3.7: Plotando o globo terrestre 





1/4 Disponivel no pacote de programas como: 


mapa. py 
2|| from matplotlib.toolkits.basemap import 


Basemap 
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3| Import pylab as p 


s|map = Basemap(projection='robin”,lat 0=-—23, 
lon 0=-—46, 

6 resolution=’1’,area_thresh 
=1000.) 

7| map. drawcoastlines () 

s| map. drawcountries () 

ə|| map. fillcontinents (color=’ coral ’) 

10|| map. drawmapboundary () 

u| map. drawmeridians(p. arange (0,360 ,30) ) 

12| map. drawparallels(p. arange(—90,90,30) ) 

13|| p. show () 

















Na listagem 3.6, criamos um objeto map, que é uma instância, 
da classe Basemap (linha 4). A classe Basemap possui diversos atri- 
butos, mas neste exemplo estamos definindo apenas alguns como 
a projeção (Robinson), coordenadas do centro do mapa, lat 0 e 
lon 0, resolução dos contornos, ajustada para baixa, e tamanho 
mínimo de detalhes a serem desenhados, area thresh, definido 
como 1000km?. 
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Figura 3.6: Mapa mundi na projeção de Robinson. 


Capitulo 4 


Ferramentas de 
Desenvolvimento 


Exposição de ferramentas voltadas para o aumento da 
produtividade em um ambiente de trabalho em compu- 
tação científica. Pré-requisitos: Capítulos 1 e 2 


omo em todo ambiente de trabalho, para aumentar a nossa 
C produtividade em Computação Científica, existem várias fer- 
ramentas além da linguagem de programação. Neste capítulo fala- 
remos das ferramentas mais importantes, na opinião do autor. 


4.1 Ipython 


A utilização interativa do Python é de extrema valia. Outros am- 
bientes voltados para computação científica, tais como Matlab ™, 
R, Mathematica TM dentre outros, usam o modo interativo como seu 
principal modo de operação. Os que desejam fazer o mesmo com o 
Python, podem se beneficiar imensamente do Ipython. 

O Ipython é uma versão muito sofisticada da shell do Python 
voltada para tornar mais eficiente a utilização interativa da lingua- 
gem Python. 
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Primeiros Passos 
Para iniciar o Ipython, digitamos o seguinte comando: 
1 $ ipython [opções] arquivos 


Muita das opções que controlam o funcionamento do Ipython não 
são passadas na linha de comando, estão especificadas no arquivo 
ipythonrc dentro do diretório /.ipython. 


Quatro opções do Ipython são consideradas especiais e devem 
aparecer em primeiro lugar, antes de qualquer outra opção: -gthread, 
-qthread, -wthread, -pylab. As três primeiras opções são vol- 
tadas para o uso interativo de módulos na construção de GUIs 
(interfaces gráficas), respectivamente GTK, Qt, WxPython. Estas 
opções iniciam o Ipython em um “thread” separado, de forma a per- 
mitir o controle interativo de elementos gráficos. A opção -pylab 
permite o uso interativo do pacote matplotlib (Ver capítulo 3). 
Esta opção executará from pylab import * ao iniciar, e permite 
que gráficos sejam exibidos sem necessidade de invocar o comando 
show (), mas executará scripts que contém show() ao final, corre- 
tamente. 


Após uma das quatro opções acima terem sido especificadas, 
as opções regulares podem seguir em qualquer ordem. Todas as 
opções podem ser abreviadas à forma mais curta não-ambígua, 
mas devem respeitar maiúsculas e minúsculas (como nas lingua- 
gens Python e Bash, por sinal). Um ou dois hífens podem ser 
utilizados na especificação de opções. 

Todas as opções podem ser prefixadas por “no” para serem des- 
ligadas (no caso de serem ativas por default). 

Devido ao grande número de opções existentes, não iremos listá- 
las aqui. consulte a documentação do Ipython para aprender sobre 
elas. Entretanto, algumas opções poderão aparecer ao longo desta 
seção e serão explicadas à medida em que surgirem. 
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Comandos Mágicos 


Uma das características mais úteis do Ipython é o conceito de co- 
mandos mágicos. No console do Ipython, qualquer linha come- 
cada pelo caractere %, é considerada uma chamada a um comando 
mágico. Por exemplo, Zautoindent liga a indentação automática 
dentro do Ipython. 

Existe uma opção que vem ativada por default no ipythonrc, 
denomidada automagic. Com esta função, os comandos mági- 
cos podem ser chamados sem o %, ou seja autoindent é enten- 
dido como hautoindent. Variáveis definidas pelo usuário podem 
mascarar comandos mágicos. Portanto, se eu definir uma variá- 
vel autoindent = 1, a palavra autoindent não é mais reconhecida 
como um comando mágico e sim como o nome da variável criada 
por mim. Porém, ainda posso chamar o comando mágico colocando 
o caractere % no início. 

O usuário pode extender o conjunto de comandos mágicos com 
suas próprias criações. Veja a documentação do Ipython sobre 
como fazer isso. 

O comando mágico Ymagic retorna um explicação dos coman- 
dos mágicos existentes. 


ZExit Sai do console Ipython. 

“%Pprint Liga/desliga formatação do texto. 
%Quit Sai do Ipython sem pedir confirmação. 
%alias Define um sinônimo para um comando. 


Você pode usar %1 para representar a linha em que o comando 
alias foi chamado, por exemplo: 


1 In [2]: alias all echo "Entrada entre 
parênteses: (%l)" 
2 In [3]: all Ola mundo 


3 Entrada entre parênteses: (Ola mundo) 
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hautocall Liga/desliga modo que permite chamar funções sem os 
parênteses. Por exemplo: fun 1 vira fun(1). 


hautoindent Liga/desliga auto-indentação. 
hautomagic Liga/desliga auto-mágica. 


hbg Executa um comando em segundo plano, em um thread sepa- 
rado. Por exemplo: %bg func(x,y,z=1). Assim que a exe- 
cução se inicia, uma mensagem é impressa no console infor- 
mando o número da tarefa. Assim, pode-se ter acesso ao re- 
sultado da tarefa número 5 por meio do comando jobs.results [5] 


O Ipython possui um gerenciador de tarefas acessível através 
do objeto jobs. Para maiores informações sobre este objeto di- 
gite jobs?. O Ipython permite completar automaticamente um 
comando digitado parcialmente. Para ver todos os métodos do 
objeto jobs experimente digitar jobs .seguido da tecla <TAB>. 


bookmark Gerencia o sistema de marcadores do Ipython. Para 
saber mais sobre marcadores digite {bookmark?. 


%cd Muda de diretório. 
colors Troca o esquema de cores. 


hcpaste Cola e executa um bloco pré-formatado da área de trans- 
ferência (clipboard). O bloco tem que ser terminado por uma 
linha contendo ——. 


hdhist Imprime o histórico de diretórios. 
Zed Sinônimo para edit 


hedit Abre um editor e executa o código editado ao sair. Este 
comando aceita diversas opções, veja a documentação. 
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O editor a ser aberto pelo comando Yedit é o que estiver defi- 
nido na variável de ambiente $EDITOR. Se esta variável não estiver 
definida, o Ipython abrirá o vi. Se não for especificado o nome de 
um arquivo, o Ipython abrirá um arquivo temporário para a edição. 

O comando Yedit apresenta algumas conveniências. Por exem- 
plo: se definirmos uma funcão fun em uma sessão de edição ao sair 
e executar o código, esta função permanecerá definida no espaço 
de nomes corrente. Então podemos digitar apenas %edit fun e 
o Ipython abrirá o arquivo que a contém, posicionando o cursor, 
automaticamente, na linha que a define. Ao sair desta sessão de 
edição, a função editada será atualizada. 


1 In [6]:%ed 

2 [Python will make a temporary file named: / 
tmp/ipython edit GuUWr. .py 

3 done. Executing edited code... 

4 Out[6]: "def fun():\n print ’fun’\n \ 
ndef funa():\n print ’funa’\n" 


In [7]: fun() 
fun 


o oO Nn oa 


In [8]: funa() 

10 funa 

TE 

12 In [9]:%ed fun 

13 done. Executing edited code... 


hist Sinônimo para (history. 


Yhistory Imprime o histórico de comandos. Comandos anteriores 
y 
também podem ser acessados através da variável _i<n>, que 
é o n-ésimo comando do histórico. 
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In [1]:% hist 
1: _ip.magic("%hist ") 


In [2]:% hist 
1: _ip.magic("%hist ") 
2: _ip.magic("%hist ") 


an an eà Ù N e 


O Ipython possui um sofisticado sistema de registro das ses- 
sões. Este sistema é controlado pelos seguintes comandos mágicos: 
logon, logoff, %logstart e Klogstate. Para maiores infor- 
mações consulte a documentação. 


hlsmagic Lista os comandos mágicos disponíveis. 


macro Define um conjunto de linhas de comando como uma macro 
para uso posterior: macro teste 1 2 ou {macro macro2 
44-47 49. 


%p Sinônimo para print. 
“pdb liga/desliga depurador interativo. 


hpdef Imprime o cabeçalho de qualquer objeto chamável. Se o 
objeto for uma classe, retorna informação sobre o construtor 
da classe. 


%pdoc Imprime a docstring de um objeto. 
hpfile Imprime o arquivo onde o objeto encontra-se definido. 
%psearch Busca por objetos em espaços de nomes. 


Zpsource Imprime o código fonte de um objeto. O objeto tem que 
ter sido importado a partir de um arquivo. 


Zquickref Mostra um guia de referência rápida 


%quit Sai do Ipython. 
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yr Repete o comando anterior. 


Yrehash Atualiza a tabela de sinônimos com todas as entradas em 
$PATH. Este comando não verifica permissões de execução e 
se as entradas são mesmo arquivos. hrehashx faz isso, mas é 
mais lento. 


Yrehashdir Adiciona os executáveis dos diretórios especificados à 
tabela de sinônimos. 


%rehashx Atualiza a tabela de sinônimos com todos os arquivos 
executáveis em $PATH. 


hreset Re-inicializa o espaço de nomes removendo todos os nomes 
definidos pelo usuário. 


Arun Executa o arquivo especificado dentro do Ipython como um 
programa. 


hrunlog Executa arquivos como logs. 
hsave Salva um conjunto de linhas em um arquivo. 
%sx Executa um comando no console do Linux e captura sua saída. 


store Armazena variáveis para que estejam disponíveis em uma 
sessão futura. 


time Cronometra a execução de um comando ou expressão. 


Wtimeit Cronometra a execução de um comando ou expressão uti- 
lizando o módulo timeit. 


Y%unalias Remove um sinônimo. 
hupgrade Atualiza a instalação do Ipython. 


who Imprime todas as variáveis interativas com um mínimo de 
formatação. 
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Ywho Is Retorna uma lista de todas as variáveis interativas. 


whos Similar ao %who, com mais informação sobre cada variável. 


Para finalizar, o Ipython é um excelente ambiente de traba- 
lho interativo para computação científica, especialmente quando 
invocado coma opção -pylab. O modo pylab além de gráficos, 
também oferece uma série de comandos de compatibilidade com o 
MATLAB™ (veja capítulo 3). O pacote principal do numpy tam- 
bém fica exposto no modo pylab. Subpacotes do numpy precisam 
ser importados manualmente. 


4.2 Editores de Código 


Na edição de programas em Python, um bom editor de código pode 
fazer uma grande diferença em produtividade. Devido a significân- 
cia dos espaços em branco para a linguagem, um editor que mantém 
a indentação do código consistente, é muito importante para evitar 
bugs. Também é desejável que o editor conheça as regras de in- 
dentação do Python, por exemplo: indentar após “:”, indentar com 
espaços ao invés de tabulações. Outra característica desejável é a 
colorização do código de forma a ressaltar a sintaxe da linguagem. 
Esta característica aumenta, em muito, a legibilidade do código. 

Os editores que podem ser utilizados com sucesso para a edição 
de programas em Python, se dividem em duas categorias básicas: 
editores genéricos e editores especializados na linguagem Python. 
Nesta seção, vamos examinar as principais características de alguns 
editores de cada categoria. 


Editores Genéricos 


Existe um sem-número de editores de texto disponíveis para o Am- 
biente Gnu/Linux. A grande maioria deles cumpre nossos requisi- 
tos básicos de indentação automática e colorização. Selecionei al- 
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guns que se destacam na minha preferência, quanto a usabilidade 
e versatilidade. 


Emacs: Editor incrivelmente completo e versátil, funciona como 
ambiente integrado de desenvolvimento (figura 4.1). Precisa 
ter “python-mode’instalado. Para quem não tem experiência 
prévia com o Emacs, recomendo que o pacote Easymacs! seja 
também instalado. este pacote facilita muito a interface do 
Emacs, principalmente para adição de atalhos de teclado pa- 
drão CUA. Pode-se ainda utilizar o Ipython dentro do Emacs. 


Scite: Editor leve e eficiente, suporta bem o Python (executa o 
script com <F5>) assim como diversas outras linguagens. 
Permite configurar comando de compilação de C e Fortran, o 
que facilita o desenvolvimento de extensões. Completamente 
configurável (figura 4.2). 


Gnu Nano: Levíssimo editor para ambientes de console, possui 
suporte a auto indentação e colorização em diversas lingua- 
gens, incluindo o Python (figura 4.3). Ideal para utilizar em 
conjunção com o Ipython (comando edit). 


Jedit: Incluí o Jedit nesta lista, pois oferece suporte ao desenvol- 
vimento em Jython (ver Seção 5.5). Afora isso, é um edi- 
tor bastante poderoso para java e não tão pesado quanto o 
Eclipse (figura 4.4). 


Kate/Gedit Editores padrão do KDE e Gnome respectivamente. 
Bons para uso casual, o Kate tem a vantagem de um console 
embutido. 





Inttp://wwu.dur.ac.uk/p.j.heslin/Software/Emacs/Easymacs/ 
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Emacs MH.py: /home/flavio/Documents/LivroPython/code/MH.py 





= ccnyeh > 


© jpywo>| 
© Jpyworl>| 
@Livro_de> 
marcos 
@Microbie> 
W-0 ...vroPytho 
B Makefile 
Bmarkov.py 
Bmathtext.py 
[E ME. py) 


-pyc 
Bmnet.c 
Bmnet.py 


B mnet . pyx 
Wi 





“W-0 History 


-OSB*EGO5 XE 























BE 
" #-*-encoding:1 
from math impo 
from numpy.ran 
from pylab imp 











def sdnorm(z): 


return exp a 


n = 10000 
alpha = 1 
x=0. 
vec = [] 
vec.append (x) 
for i in xrang 
finovação 
innov = un 
can = x + 
#probabili 
aprob = mi 
u = unifor. 
if u < apr 
x= ca 
vec.ap 
subplot (211) 
plot (vec) 
subplot (212) 
title('Metropo 


hist (vec, bins=su) 
ylabel (u Frequéncia') 


xlabel ( Vec') 
show() 


Comment Out Region (C-c #) 
Uncomment Region 


Mark current block (C-c C-k) 
Mark current def (C-M-h) 
Mark current class 


Import/reload file (C-c RET) 
Execute buffer (C-c C-c) 
iter (C-c |) 
for class (C-M-x) na dist. uniforme 
Execute string (C-c C-s) 
Start interpreter... (C-c !) 


Go to start of block (C-c C-u) '®} D) 
Go to start of class 
Move to end of class 
Move to start of def 
Move to end of def 


(C-M-a) 
(C-M-e) 


Describe mode (C-c ?) 





A11 (28,6) (Python Fly Outl s1)-------- 








Figura 4.1: Editor emacs em modo Python e com “Code Browser” 


ativado 
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mnet.py - SciTE 


mnet.py Compile Ctrl+F7 
Inc Build zy n/code/mnet.py 

import email, sy Sº F5 

import email.Erı ali Check Ctrl+1 

import mailbox Stop Executing 

import network» Next Message F4 

from pylab imp« Previous Message  Shift+F4 

Clear Output Shift+F5 

Switch Pane Ctrl+F6 


wre 














-def msgfactory 
- try: 
return email.message_from_file(fp) 


except email.Errors.MessageParseError: 
return '' 


def starG(mess,G): 

try: 
centro = mess.get('from').split()[-1].strip('<>') 
pontas = [j.split()[-1].strip('<>') for j in mess.get all('to')[0]. 
arestas = [(centro,k) for k in pontas] 
G.add edges from(arestas) 
return G 

except: 
print 'falhou' 


dir=! /hama /f1lauwin/Msil /inhav'! 





“4 


Figura 4.2: Editor Scite. 


Editores Especializados 


Editores especializados em Python tendem a ser mais do tipo IDE 
(ambiente integrado de desenvolvimento), oferecendo funcionalida- 
des que s6 fazem sentido para gerenciar projetos de médio a grande 
porte, sendo “demais” para se editar um simples Script. 


Boa-Constructor: O Boa-constructor é um IDE, voltado para o 
projetos que pretendam utilizar o WxPython como interface 
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Console do Linux - Konsole 
Sessão Editar Ver Favoritos Configurações Ajuda 


GNU 2.0.2 Arquivo: grafodin.py 


~ networkx as NX] 
threading, random, pylab as P 


= Contagio: 
= init (self,nome): 
self.nome = nome 
self.doente = 0 
self.transmite() 
=- transmite(self): 
= G.doentes == G.order(): 
repurt 
= alvo | random.sample(G.nodes(),3): 
= alvo.doente: 
G.add edge((self,alvo)) 
Co %(self.nome, alvo.nome) 
t = threading. Thread(target=alvo.contraiu()) 
[ lin 1/34 (2%), col 22/22 (100%), carac 21/886 (2%) ] 
^G Ajuda ^0 Gravar ^R Ler o Arq^Y Página An*K Recortar ^C Pos Atual 
^X Sair ^J Justifica*W Onde está”V Próxima P*U Colar Txt”T Para Spel . 


Ie] e Console do Linux fo 


Figura 4.3: Editor Gnu Nano. 








gráfica. Neste aspecto ele é muito bom, permitindo cons- 
trução visual da interface, gerando todo o código associado 
com a interface. Também traz um excelente depurador para 
programas em Python e dá suporte a módulos de extensão 
escritos em outras linguagens, como Pyrex ou C(figura 4.5). 


Eric: O Eric também é um IDE desenvolvido em Python com a 
interface em PyQt. Possui boa integração com o gerador de 
interfaces Qt Designer, tornando muito fácil o desenvolvi- 
mento de interfaces gráficas com esta ferramenta. Também 
dispõe de ótimo depurador. Além disso o Eric oferece muitas 
outras funções, tais como integração com sistemas de controle 
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jEdit - Graph.py 


File Edit Search Markers Folding View Utilities Macros Plugins Help 


FEO AB 00¢88 AX DaN 

















à Graph. py (/usr/share/jvthan/Demofawt/) 
from java import awt. 
from math import *. 
from jarray import array. 


class Graph(awt. Canvas): . 
def _init_(self):. 
self. function = None. 


def paint(self, g):. 
if self. function is None:. 
return self.error(g). 


sz = self.size. 
xs = range(0, sz.width, 2). 


xscale = 4*pi/sz.width. 
xoffset = -2*pi. 


yscale = -sz.height/2.. 
yotfset = sz.height/2.. 


ys= 0. 

for x in xs:. 
x = xscale*x + xoffset. 
y = int(yscale*sel f. function(x)+yoffset). 
ys.appendcy). 

g.drawPolyline(array(xs, '1'), array(ys, 1), Ten(xs)). 


r(self, g):. 

message = "Invalid Expression”. 

g. font = awt.Font¢'Serit! -Font.BOLD, 20). 
width = g. fontMetrics. stringilt ith (message) . 


x = (self. size.width-width)/2. 
y = (self. size. height+g. fontMetrics.height)/2. 
Q.drawString(*Invalid Expression", x, y). 


def setExoressionfself, el: 





mem [r RAOS 


This shell runs operating system processes. 





Press TAB with an empty command line to list 
built-in commands. 

Run built-in with --help argument to get a 
brief usage message. 

Run %help to view Console plugin online help. 


Errors generated by compilers and some other 
programs are listed 

for easy one-click access in the 
"Plugins->Error List->Error List! 

window. 

/usr/share/jedit> 























EE 


ID) 








1,1 Top (python, none, ISO-885 9-1) - - - - U MENEE Mb 


Figura 4.4: Editor “Jython” Jedit 


de versão, geradores de documentação, etc.(Figura 4.6). 


Pydev (Eclipse): O Pydev, é um IDE para Python e Jython 
desenvolvido como um plugin para Eclipse. Para quem já 
tem experiência com a plataforma Eclipse, pode ser uma boa 
alternativa, caso contrário, pode ser bem mais complicado 
de operar do que as alternativas mencionadas acima (Figura 
4.7). Em termos de funcionalidade, equipara-se ao Eric e ao 


Boa-constructor. 
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a Boa Constructor - Python IDE - wxPython GUI Builder - Zope Editor BEE 
SIN O (Nadaselecionad @ @ @ x 


Novo Contéineres/Leiaute | Controles básicos Botões Controles de listas | Biblioteca Usuario Utilitários (Dados) Zope 





alala a saa a 144 





a Inspetor -lolx jA Editor - wxFrame1 - file:///home/fiavio/Documents/Projetos/modelbuilder/mode|_builderiwxFramet.py 
E XFM ve ane 


Constr | Props Evts| Objs ato SAB >> PRM BAG KEE CAE HO ré 
‘@Shell QExplorador GIPyMB | OwxFramet @lhsframe 


Fonte Explorar) Eventos UML Documentação A fazer | Hierarquia 


wxFramel. py 


<Flavio Codeco Coelho> 


2003/02/04 
$Id: wsPramel.py,v 1.11 2004/01/13 10:51:43 focoelho Exp $ 
(E) 2093 Plavi Codece Coelho <ecoslhoBticcras, ne» 
RC O Em 
f moaity de TA terme of the CND General Public License 
| shed by ske Fres software Foundation) either version 2 
Piceiunemilosnearie= (KE LE cucionl ANY IATE TOEREN 


t 
| f this progran is distributed in the hope shat it will be useful, 
# but WITHOUT ANY WARRANTY; without implied warranty of 
É firechannantnony or PIMES FOR A PAN TOMAR capone, See the 
E A E 


ved a copy af the GRO General publie License 


amel 
future import division 
import wxversian 
wxversion.select('2,6') 
import nx 
import yx.sto 
#from Numeric import + 
Erom threading import * 
| cio, tape terete 
#from Randomarray im 
| Eca npr randon inport * 


import pickle 





























E um óA] E gkrelim S examples - Konquerc & Inspetor p - — 
Esse m ha I| © Gmail - Inbox - Mozi @Boa Constructor - Py Xi Editor - wxFramet (mane nadam EM. 


Figura 4.5: IDE Boa-Constructor 


4.3 Controle de Versões em Software 


Ao se desenvolver software, em qualquer escala, experimentamos 
um processo de aperfeiçoamento progressivo no qual o software 
passa por várias versões. Neste processo é muito comum, a um 
certo estágio, recuperar alguma funcionalidade que estava presente 
em uma versão anterior, e que, por alguma razão, foi eliminada do 
código. 

Outro desafio do desenvolvimento de produtos científicos (soft- 
ware ou outros) é o trabalho em equipe em torno do mesmo ob- 
jeto (frequentemente um programa). Normalmente cada membro 
da equipe trabalha individualmente e apresenta os seus resultados 
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epigrass-CVS - /home/flavio/Documents/Projetos/Epigrass/Epigrass-devel/epigrass.py - Eric 
File Edit View Debug Unittest Project Refactoring Extras Settings Window Bookmarks Help 
@O0\EOGH|s\0 +7 45a8 +a Hoocolxam|$% aaa Z 38 44 
oa an: Z|20046 CSU Na DAGAM|aS Pe 4545 
ajsãa 08) 
epigrass.py | qigraph.py | managerpy | cpanelpy | aboutpy | dataObjectpy | dgraph.py o 
qule/sleoj=aja] 


= def. init (selfparent = None,name = None fl = 0): epigrass py:19: init 














“|[Locals | Value Type 
fi 0 Integer 
os.chdir(owd.getpwuid(os.getuid( MESI) name None None 
Hfos.access(’ eplarassre",os.F OK): parent None None 
try: elseif < main Mai. main MainPanei impl 
self.cont = sell.loadRcrle( .eplorassre') 
conf settings. Language") 


# sot Translation 





except: 
fang =" 
#print lang 
else: lang = "" 
tr = QTranslatortapp) 
loadLangtapp,trilang) 


MainPanel._init_(self,parent,name,fl) 

# Overload connections 
self.connect{self.editButton,SIGNAL(relensed ()"),selfieditscript) 
self.connect{self.chooseButton, SIGNAL(*released()"),self.chooseScript) 
self.connect{self.buttonExit, SIGNAL( "released 
self.connect{self.buttonRun,SIGNAL(" released: 
self.connect{self.buttonHelp,SIGNAL(*release: 
self.connect{self.dbBackup,SIGNAL(" released() ") seit. banca 
self.connecifsel.dbinfo SIGNAL('released| )"),self.onDbinio) 
self.connect{self.repOpen, SIGNAL("reLeased()"),self.onepOpen) 
self.connect{self.playButton, SIGNAL("reLeased()"),self.onPlayButton) 
































seifeofmect{ettstbacanfution SONALI" retos) neon) E 








1 Python 2. AT 1, Nov 10 2006, 14:34:40) 

2 [GCC 4.1.1 (Gentoo 4.1.1-r1)] on Sabayon, No Qi-Version, threaded 

3 >>> jusifibfeythion? 4/site-packages/matplotlib/_init_.py:155: UserWarning: Module Epigrass was already imported from /home/flavio/Documents/Projetos/Epigrass/Epigrass-devel/Epigrass/ 
_init_.pyc, but fusr/lib/python2.4/site-packages/epigrass-1.4.7-py2.4.cag is being added to sys.path 
_import_(*pkg_resources' ).declare_namespace(_name_) 

5 jusr/lib/python2.4/site-packages/numpy-1.0-py2.4-linux-i686.eag/numpy/ctypeslib.py:12: UserWarning: All features of ctypes interface may not work with ctypes < 1.0.1 

6 warnings.warn(*All features of ctypes interface may not work with "\ 





[rw/File: home/fi/./Projetos/Epigrass/Epigrass-devel/epigrass.py|Line: 19|Pos: 0 


Figura 4.6: IDE Eric. 


para a equipe em reuniões regulares. O que fazer quando modifica- 
ções desenvolvidas por diferentes membros de uma mesma equipe 
se tornam incompatíveis? Ou mesmo, quando dois ou mais colabo- 
radores estão trabalhando em partes diferentes de um programa, 
mas que precisam uma da outra para funcionar? 


O tipo de ferramenta que vamos introduzir nesta seção, busca 
resolver ou minimizar os problemas supracitados e pode ser apli- 
cado também ao desenvolvimento colaborativo de outros tipos de 
documentos, não somente programas. 


Como este é um livro baseado na linguagem Python, vamos uti- 
lizar um sistema de controle de versões desenvolvido inteiramente 
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Pydev - grafodin.py - Eclipse SDK 

















































Bribe 
ala s |$ oa |4 arbres = @Pydev > 
“E Bhelopy 2 oa in.py E E tine = he + x 75) 
import networkx as NK IX = networkx 
ihor Chreeding. rendon; ya as P 7 
threading, random, P = pylab 
ae class Centagio: lo j 
ale def init (self,nome): j a Cantegia 
ti hello py E > into 
| B project © transmite 
© contraiu 
tes == G.order(): ES 
for alvo in random Sanpete nodes(),3): * G.doentes 
if not alvo. doer eee 
G.ada, coe (sei alvo)) | 
print "ss infeciou %s"%(self.nome, alvo.nome) © caso, indice 
f= threading. thread(targeteatvo.cont raiu()) E 
Né nomes 
= [Contagio(n) for n in xrange(89)] 
kd nodes RARE 
des () 10] 
ul) 
s das arestas is pe PACE density(G)) 
print Nk.degree histogran(G), G.c 
Fanes = diettrinono.nene) tar no in &-nodes(]1) 
NX.drew(G, labels=nomes, alpha-0.7,width-3, style='dotted', node_size=459, font_size=14) 
P.show() 
E Problems 1i \ Console) EEE) 
O errors, O warnings, O infos | 
Pydev: forcing tabs Writable Insert 26:23 


Figura 4.7: IDE Pydev 


em Python: Mercurial’. Na prática o mecanismo por trás de 
todos os sistemas de controle de versão é muito similar. Migrar 
de um para outro é uma questão de aprender novos nomes para 
as mesmas operações. Além do mais, o uso diário de sistema de 
controle de versões envolve apenas dois ou três comandos. 


Entendendo o Mercurial 


O Mercurial é um sistema de controle de versões descentralizado, 
ou seja, não há nenhuma noção de um servidor central onde fica 





2http://uww.selenic.com/mercurial 
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Diretorio de trabalho 


Figura 4.8: Diagrama de um repositório do Mercurial. 





depositado o código. Repositórios de códigos são diretórios que 
podem ser “clonados” de uma máquina para outra. 

Então, em que consiste um repositório? A figura 4.8 é uma 
representação diagramática de um repositório. Para simplificar 
nossa explanação, consideremos que o repositório já foi criado ou 
clonado de alguém que o criou. Veremos como criar um repositório 
a partir do zero, mais adiante. 

De acordo com a figura 4.8, um repositório é composto por 
um Arquivo? e por um diretório de trabalho. O Arquivo contém 
a história completa do projeto. O diretório de trabalho contém 
uma cópia dos arquivos do projeto em um determinado ponto no 
tempo (por exemplo, na revisão 2). É no diretório de trabalho que 
o pesquisador trabalha e atualiza os arquivos. 





*Doravante grafado com “A” maiúsculo para diferenciar de arquivos co- 
muns(files). 
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Diretorio de trabalho 


Figura 4.9: Operação de “commit”. 





Ao final de cada ciclo de trabalho, o pesquisador envia suas 
modificações para o arquivo numa operação denominada “com- 
mit”(figura 4.9)*. 

Após um commit, como as fontes do diretório de trabalho não 
correspondiam à última revisão do projeto, o Mercurial automati- 
camente cria uma ramificação no arquivo. Com isso passamos a ter 
duas linhas de desenvolvimento seguindo em paralelo, com o nosso 
diretório de trabalho pertencendo ao ramo iniciado pela revisão 4. 

O Mercurial agrupa as mudanças enviadas por um usuário 
(via commit), em um conjunto de mudanças atômico, que constitui 





“Vou adotar o uso da palavra commit para me referir a esta operação daqui 
em diante. Optei por não tentar uma tradução pois este termo é um jargão 
dos sistemas de controle de versão. 
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Figura 4.10: Repositório da Ana. 


uma revisão. Estas revisões recebem uma numeração sequencial 
(figura 4.9). Mas como o Mercurial permite desenvolvimento de 
um mesmo projeto em paralelo, os números de revisão para di- 
ferentes desenvolvedores poderiam diferir. Por isso cada revisão 
também recebe um identificador global, consistindo de um número 
hexadecimal de quarenta dígitos. 

Além de ramificações, fusões (“merge”) entre ramos podem ocor- 
rer a qualquer momento. Sempre que houver mais de um ramo 
em desenvolvimento, o Mercurial denominará as revisões mais re- 
centes de cada ramo(heads, cabeças). Dentre estas, a que tiver 
maior número de revisão será considerada a ponta (tip) do repo- 
sitório. 


Exemplo de uso: 


Nestes exemplos, exploraremos as operações mais comuns num am- 
biente de desenvolvimento em colaboração utilizando o Mercurial. 
Vamos começar com nossa primeira desenvolvedora, chamada 
Ana. Ana possui um arquivo como mostrado na figura 4.10. 
Nosso segundo desenvolvedor, Bruno, acabou de se juntar ao 
time e clona o repositório Ana”. 


1 $ hg clone ssh://maquinadana/projeto 
meuprojeto 
2 requesting all changes 





5 Assumimos aqui que a máquina da ana está executando um servidor ssh 
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Figura 4.11: Modificações de Bruno. 


Figura 4.12: Modificações de Ana. 


adding changesets 

adding manifests 

adding file changes 

added 4 changesets with 4 changes to 2 files 


a oa è O 


URLs válidas: 
file:// 
http:// 
https:// 


ssh:// 
static-http:// 


Após o comando acima, Bruno receberá uma cópia completa 
do arquivo de Ana, mas seu diretório de trabalho, meu projeto, 
permanecerá independente. Bruno está ansioso para começar a 
trabalhar e logo faz dois commits (figura 4.11). 

Enquanto isso, em paralelo, Ana também faz suas modificações 
(figura 4.12). 

Bruno então decide “puxar” o repositório de Ana para sincronizá- 
lo com o seu. 


1 $ hg pull 
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Figura 4.13: Repositório atualizado de Bruno. 


pulling from ssh://maquinadaana/projeto 

searching for changes 

adding changesets 

adding manifests 

adding file changes 

added 1 changesets with 1 changes to 1 files 

(run “hg heads’ to see heads, 'hg merge’ to 
merge) 


DI own AÀA O N 


O comando hg pull, se não especificada a fonte, irá “puxar” 
da fonte de onde o repositório local foi clonado. Este comando 
atualizará o Arquivo local, mas não o diretório de trabalho. 

Após esta operação o repositório de Bruno fica como mostrado 
na figura 4.13. Como as mudanças feitas por Ana, foram as últimas 
adicionadas ao repositório de Bruno, esta revisão passa a ser a 
ponta do Arquivo. 

Bruno agora deseja fundir seu ramo de desenvolvimento, com 
a ponta do seu Arquivo que corresponde às modificações feitas 
por Ana. Normalmente, após puxar modificações, executamos hg 
update para sincronizar nosso diretório de trabalho com o Arquivo 
recém atualizado. Então Bruno faz isso. 


1 $ hg update 

2 this update spans a branch affecting the 
following files: 

3 hello.py (resolve) 
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Figura 4.14: Repositório de Bruno após a fusão. 


4 aborting update spanning branches! 
s (use ’hg merge’ to merge across branches or 
'hg update —C’ to lose changes) 


Devido à ramificação no Arquivo de Bruno, o comando update 
não sabe a que ramo fundir as modificações existentes no diretório 
de trabalho de Bruno. Para resolver isto, Bruno precisará fundir 
os dois ramos. Felizmente esta é uma tarefa trivial. 


1 $ hg merge tip 
2 merging hello .py 


No comando merge, se nenhuma revisão é especificada, o dire- 
tório de trabalho é cabeça de um ramo e existe apenas uma outra 
cabeça, as duas cabeças serão fundidas. Caso contrário uma revisão 
deve ser especificada. 

Pronto! agora o repositório de Bruno ficou como a figura 4.14. 


Agora, se Ana puxar de Bruno, receberá todas as moficações de 
Bruno e seus repositórios estarão plenamente sincronizados, como 
a figura 4.14. 


Criando um Repositório 
Para criar um repositório do zero, é preciso apenas um comando: 


1 $ hg init 
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Quando o diretório é criado, um diretório chamado .hg é criado 
dentro do diretório de trabalho. O Mercurial irá armazenar todas 
as informações sobre o repositório no diretório .hg. O conteúdo 
deste diretório não deve ser alterado pelo usuário. 


Para saber mais 


Naturalmente, muitas outras coisas podem ser feitas com um sis- 
tema de controle de versões. O leitor é encorajado a consultar a 
documentação do Mercurial para descobrí-las. Para servir de re- 
ferência rápida, use o comando hg help -v <comando> com qual- 
quer comando da lista abaixo. 


add Adiciona o(s) arquivo(s) especificado(s) no próximo commit. 


addremove Adiciona todos os arquivos novos, removendo os faltan- 
tes. 


annotate Mostra informação sobre modificações por linha de ar- 
quivo. 


archive Cria um arquivo (compactado) não versionado, de uma 
revisão especificada. 


backout Reverte os efeitos de uma modificação anterior. 
branch Altera ou mostra o nome do ramo atual. 
branches Lista todas os ramos do repositório. 


bundle Cria um arquivo compactado contendo todas as modifica- 
ções não presentes em um outro repositório. 


cat Retorna o arquivo especificado, na forma em que ele era em 
dada revisão. 


clone Replica um repositório. 
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commit Arquiva todas as modificações ou os arquivos especificados. 


copy Copia os arquivos especificados, para outro diretório no pró- 
ximo commit. 


diff Mostra diferenças entre revisões ou entre os arquivos especi- 
ficados. 


export Imprime o cabeçalho e as diferenças para um ou mais con- 
juntos de modificações. 


grep Busca por palavras em arquivos e revisões específicas. 
heads Mostra cabeças atuais. 


help Mostra ajuda para um comando, extensão ou lista de coman- 
dos. 


identify Imprime informações sobre a cópia de trabalho atual. 


import Importa um conjunto ordenado de atualizações (patches). 
Este comando é a contrapartida de Export. 


incoming Mostra novos conjuntos de modificações existentes em 
um dado repositório. 


init Cria um novo repositório no diretório especificado. Se o di- 
retório não existir, ele será criado. 


locate Localiza arquivos. 


log Mostra histórico de revisões para o repositório como um todo 
ou para alguns arquivos. 


manifest Retorna o manifesto (lista de arquivos controlados) da 
revisão atual ou outra. 


merge Funde o diretório de trabalho com outra revisão. 
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outgoing Mostra conjunto de modificações não presentes no repo- 
sitório de destino. 


parents Mostra os “pais” do diretório de trabalho ou revisão. 
paths Mostra definição de nomes simbólicos de caminho. 
pull “Puxa” atualizações da fonte especificada. 


push Envia modificações para o repositório destino especificado. 
E a contra-partida de pull. 


recover Desfaz uma transação interrompida. 
remove Remove os arquivos especificados no próximo commit. 
rename Renomeia arquivos; Equivalente a copy + remove. 


revert Reverte arquivos ao estado em que estavam em uma dada 
revisão. 


rollback Desfaz a última transação neste repositório. 
root Imprime a raiz do diretório de trabalho corrente. 
serve Exporta o diretório via HTTP. 


showconfig Mostra a configuração combinada de todos os arqui- 
vos hgrc. 


status Mostra arquivos modificados no diretório de trabalho. 
tag Adiciona um marcador para a revisão corrente ou outra. 
tags Lista marcadores do repositório. 

tip Mostra a revisão “ponta”. 


unbundle Aplica um arquivo de modificações. 
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update Atualiza ou funde o diretório de trabalho. 
verify Verifica a integridade do repositório. 


version Retorna versão e informação de copyright. 


Capitulo 5 


Interagindo com Outras 
Linguagens 


Introdução a vários métodos de integração do Python 
com outras linguagens. Pré-requisitos: Capítulos 1 e 
2. 


5.1 Introdução 


O Python é uma linguagem extremamente poderosa e versátil, per- 
feitamente apta a ser, não somente a primeira, como a última lin- 
guagem de programação que um cientista precisará aprender. En- 
tretanto, existem várias situações nas quais torna-se interessante 
combinar o seu código escrito em Python com códigos escritos em 
outras linguagens. Uma das situações mais comuns, é a necessi- 
dade de obter maior performance em certos algoritmos através da 
re-implementação em uma linguagem compilada. Outra Situação 
comum é possibilidade de se utilizar de bibliotecas desenvolvidas 
em outras linguagens e assim evitar ter que reimplementá-las em 
Python. 

O Python é uma linguagem que se presta. extremamente bem. 
a estas tarefas existindo diversos métodos para se alcançar os obje- 
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tivos descritos no parágrafo acima. Neste capitulo, vamos explorar 
apenas os mais práticos e eficientes, do ponto de vista do tempo de 
implementação. 


5.2 Integração com a Linguagem C 


A linguagem C é uma das linguagens mais utilizadas no desenvol- 
vimento de softwares que requerem alta performance. Um bom 
exemplo é o Linux (kernel) e a própria linguagem Python. Este 
fato torna o C um candidato natural para melhorar a performance 
de programas em Python. 

Vários pacotes científicos para Python como o Numpy e Scipy, 
por exemplo, tem uma grande porção do seu código escrito em 
C para máxima performance. Coincidentemente, o primeiro mé- 
todo que vamos explorar para incorporar código C em programas 
Python, é oferecido como parte do pacote Scipy. 


Weave 


O weave é um módulo do pacote scipy, que permite inserir trechos 
de código escrito em C ou C++ dentro de programas em Python. 
Existem várias formas de se utilizar o weave dependendo do tipo 
de aplicação que se tem. Nesta seção, vamos explorar apenas a 
aplicação do módulo inline do weave, por ser mais simples e co- 
brir uma ampla gama de aplicações. Além disso, utilizações mais 
avançadas do weave, exigem um conhecimento mais profundo da 
linguagem C, o que está fora do escopo deste livro. Caso os exem- 
plos incluídos não satisfaçam os anseios do leitor, existe uma farta 
documentação no site www.scipy.org. 

Vamos começar a explorar o weave com um exemplo trivial 
(computacionalmente) um simples loop com uma única operação 
(exemplo 5.1). 
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23 
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26 
27 
28 
29 


Listagem 5.1: Otimização de loops com o weave 











#—*—encoding: latin —1—*— 

# Disponivel no pacote de programas como: 
weaveloop.py 

from scipy.weave import inline , converters 

import time 

from pylab import x 


code=""" 

int i=0; 

while (i < n) 
{ 
Laa: 
i++; 
"mun 


def loopp (n): 


i=0 

while i < n: 
i**3 
i+=1 


def loopc(n): 
return inline (code,|’n’], 
type _converters=converters. blitz 
,compiler=’ gcc’) 


def bench (max) : 


ptim = [] 

ctim = [] 

for n in xrange(100,max,100): 
t = time. time() 
loopp (n) 


t1=time.time()-t 
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30 ptim.append(t1) 

31 t = time. time () 

32 loopc(n) 

33 tl=time. time ()—-t 

34 ctim.append(t1) 

35 return ptim,ctim ,max 


36 
37|| ptim , ctim ,max = bench(10000) 

ss|| semilogy (xrange(100 ,max,100) ‚ptim , ’b—o’, 
xrange(100,max,100) ,ctim , ’g—o’) 

so|| ylabel( "tempo em segundos ');xlabel (u' Número 
de operações’); grid () 

4o|| legend ([ Python’, ’C’]) 

al savefig (’ weaveloop . png’ ,dpi=400) 

42|| show () 

















No exemplo 5.1 podemos ver como funciona o weave. Uma 
string contém o código C a ser compilado. A função inline com- 
pila o código em questão, passando para o mesmo as variáveis ne- 
cessárias. 

Note que, na primeira execução do loop, o weave é mais lento 
que o Python, devido à compilação do código; mas em seguida, 
com a rotina já compilada e carregada na memória, este atraso não 
existe mais. 

O weave. inline tem uma performance inferior à de um pro- 
grama em C equivalente, executado fora do Python. Mas a sua 
simplicidade de utilização, compensa sempre que se puder obter 
um ganho de performance sobre o Python puro. 


Listagem 5.2: Calculando iterativamente a série de Fibonacci em 
Python e em C(weave. inline) 





ll Disponivel no pacote de programas como: 
weavefib.py 
2|| from scipy import weave 
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Figura 5.1: Comparação da performance entre o Python e o € 
(weave) para um loop simples. O eixo y está em escala logaritmica 
para facilitar a visualização das curvas. 


from scipy.weave import converters 
import time 

from scipy.stats import bayes mvs 
from pylab import x 


code=\ 


na 


o o q De A Ww 


1) while (b < n) 


11 { 


12 int savea = a; 











N 
q 
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35 
36 
37 
38 
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a=b; 
b=savea-+b; 
return val = a; 


def fibp(n): 


def fibw(n): 


ptim =|]; ctim =|] 
for i in range(100): 
t = time.time() 
pn = fibp (1000000000) 
pt = time. time ()-t; ptim .append (pt) 
fibw(10)#to compile before timing 
t = time. time() 
cn = fibw (1000000000) 
ct = time.time()—t; ctim .append(ct) 
“Tempo médio no python: %g segundos ’% 


print 


nua 


Calcula série de Fibonacci em Python 
ween 


a,b = 0,1 
while b < n: 

a,b = b,a+b 
return a 


nua 


Versão weave. inline 
maca 


a=0 
b=1 
return weave.inline(code,['n','a','b 


4 : 
type converters=converters. blitz, 
compiler=’ gcc’) 
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pt 

45| print "Tempo médio no weave: %g segundos '% 
ct 

se| Stats = bayes mvs(array (ptim)/array (ctim)) 
a7|| print "Aceleração média: %g + %g "% (Stats 
[01[0], 

as| Stats [2][0]) 

















No exemplo 5.2, o ganho de performance do weave. inline já 
não é tão acentuado. 


Listagem 5.3: Executando o código do exemplo 5.2. 





i] $ python weavefib.py 

2|| Tempo médio no python: 1.69277e-05 segundos 
3|| Tempo médio no weave: 1.3113e—05 segundos 

4| Aceleração média: 1.49554 + 0.764275 














Ctypes 


O pacote ctypes, parte integrante do Python a partir da versão 
2.5, é um módulo que nos permite invocar funções de bibliotecas 
em C pré-compiladas, como se fossem funções em Python. Apesar 
da aparente facilidade de uso, ainda é necessário ter consciência do 
tipo de dados a função, que se deseja utilizar, requer. Por conse- 
guinte, é necessário que o usuario tenha um bom conhecimento da 
linguagem C. 

Apenas alguns objetos do python podem ser passados para 
funções através do ctypes: None, inteiros, inteiros longos, 
strings, e strings unicode. Outros tipos de dados devem ser 
convertidos, utilizando tipos fornecidos pelo ctypes, compatíveis 
com C. 

Dado seu estágio atual de desenvolvimento, o ctypes não é 
a ferramenta mais indicada ao cientista que deseja fazer uso das 
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conveniéncias do C em seus programas Python. Portanto, vamos 
apenas dar dois exemplos básicos para que o leitor tenha uma ideia 
de como funciona o ctypes. Para maiores informações recomen- 
damos o tutorial do ctypes (http: //python.net/crew/theller/ 
ctypes/tutorial.html) 

Nos exemplos abaixo assumimos que o leitor está utilizando 
Linux pois o uso do ctypes no Windows não é idêntico. 


Listagem 5.4: Carregando bibliotecas em C 





>>> from ctypes import x 

>>> libe = cdll.LoadLibrary("libc.so.6") 
>>> libe 

<CDLL ’libc.so.6’, handle ... at ...> 


e Ù N e 














Uma vez importada uma biblioteca (listagem 5.4), podemos 
chamar funções como atributos das mesmas. 


Listagem 5.5: Chamando fuções em bibliotecas importadas com o 
ctypes 




















>>> libc.printf 

2\|<_FuncPtr object at 0x... > 

3| >>> print libc.time(None) 

4|| 1150640792 

s| >>> printf = libc.printf 

e| >>> printf("Ola, %s\n", "Mundo! ") 
7|| Ola, Mundo! 

Pyrex 


O Pyrex é uma linguagem muito similar ao Python feita para gerar 
módulos em C para o Python. Desta forma, envolve um pouco 
mais de trabalho por parte do usuário, mas é de grande valor para 
acelerar código escrito em Python com pouquíssimas modificações. 
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O Pyrex não inclui todas as possibilidades da linguagem Python. 
As principais modificações são as que se seguem: 


e Não é permitido definir funções dentro de outras funções; 


e definições de classe devem ocorrer apenas no espaço de no- 
mes global do módulo, nunca dentro de funções ou de outras 
classes; 


e Não é permitido import *. As outras formas de import são 
permitidas; 


e Geradores não podem ser definidos em Pyrex; 
e As funções globals() e locals() não podem ser utilizadas. 


Além das limitações acima, existe um outro conjunto de limita- 
ções que é considerado temporário pelos desenvolvedores do Pyrex. 
São as seguintes: 


e Definições de classes e funções não podem ocorrer dentro de 
estruturas de controle (if, elif, etc.); 


e Operadores in situ (+=, *=, etc.) não são suportados pelo 
Pyrex; 


e List comprehensions não são suportadas; 
e Não há suporte a Unicode. 


Para exemplificar o uso do Pyrex, vamos implementar uma fun- 
ção geradora de números primos em Pyrex (listagem 5.6). 


Listagem 5.6: Calculando números primos em Pyrex 





# Calcula numeros primos 
def primes(int kmax): 
cdef int n, k, i 
cdef int p[1000] 


e ù N re 
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5 result = [] 

6 if kmax > 1000: 

7 kmax = 1000 

8 k = 0 

9 Tx === 

10 while k < kmax: 

11 = 

12 while i < k and n % p[i] < 0: 
13 Ll=>D1+1 

14 if i— 

15 p[k] =n 

16 ka= + 1 

17 result .append(n) 

18 n=>n+1 

19 return result 

















Vamos analisar o código Pyrex, nas linhas onde ele difere do que 
seria escrito em Python. Na linha 2 encontramos a primeira pe- 
culiaridade: o argumento de entrada kmax é definido como inteiro 
por meio da expressão int kmax. Em Pyrex, devemos declarar os 
tipos das variáveis. Nas linhas 3 e 4 também ocorre a declaração 
dos tipos das variáveis que serão utilizadas na função. Note como 
é definida uma lista de inteiros. Se uma variável não é declarada, 
o Pyrex assume que ela é um objeto Python. 

Quanto mais variáveis conseguirmos declarar como tipos básicos 
de C, mais eficiente será o código C gerado pelo Pyrex. A variável 
result(linha 5) não é declarada como uma lista de inteiros, pois 
não sabemos ainda qual será seu tamanho. O restante do código 
é equivalente ao Python. Devemos apenas notar a preferência do 
laço while ao invés de um laço do tipo for i in range(x). Este 
ultimo seria mais lento devido a incluir a função range do Python. 

O próximo passo é gerar a versão em C da listagem 5.6, compilar 
e linká-lo, transformando-o em um módulo Python. 
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Listagem 5.7: Gerando Compilando e linkando 





= 


$ pyrexc primes .pyx 

$ gec —c —fPIC —I/usr/include/python2.4/ 
primes. c 

3 $ gcc —shared primes.o —o primes.so 


N 














Agora vamos comparar a performance da nossa função com 
uma função em Python razoávelmente bem implementada (Lista- 
gem 5.8). Afinal temos que dar uma chance ao Python, não? 


Listagem 5.8: Calculando números primos em Python 





1% Disponivel no pacote de programas como: 
primes2.py 

2|| def primes (N): 

3 if N <= 3: 

4 return range (2,N) 

5 #testa apenas os numeros impares 

6 primos = [2] + range(3,N,2) 

7 index = 1 

8 #convertendo em inteiro 

9 #para acelerar comparacao abaixo 

10 top = int(N ** 0.5) 

11 while 1: 

12 i = primos [index] 

13 if i>top: 

14 break 

15 index += 1 

16 primos = |x for x in primos if (x% 

i) or (x = i)] 
17 return primos 
is|| primes (100000) 

















Comparemos agora a performance das duas funções para en- 
contrar todos os números primos menores que 100000. Para esta 
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comparacao utilizaremos o ipython que nos facilita esta tarefa atra- 
vés da função mágica {timeit. 


Listagem 5.9: Comparando performances dentro do ipython 





In [1]:from primes import primes 

In [2]:from primes2 import primes as primesp 
In [3]:\%timeit primes(100000) 

10 loops, best of 3: 19.6 ms per loop 

In [4]:\%timeit primesp (100000) 

10 loops, best of 3: 512 ms per loop 


a nan FF Ù N e 

















Uma das desvantagens do Pyrex é a necessidade de compilar e 
linkar os programas antes de poder utilizá-los. Este problema se 
acentua se seu programa Python utiliza extensões em Pyrex e pre- 
cisa ser distribuido a outros usuários. Felizmente, existe um meio 
de automatizar a compilação das extensões em Pyrex, durante a 
instalação de um módulo. O pacote setuptools, dá suporte à compi- 
lação automática de extensões em Pyrex. Basta escrever um script 
de instalação similar ao da listagem 5.10. Uma vez criado o script 
(batizado, por exemplo, de setupyx.py), para compilar a nossa ex- 
tensão, basta executar o seguinte comando: python setupix.py 
build. 

Para compilar uma extensão Pyrex, o usuário deve natural- 
mente ter o Pyrex instalado. Entretanto para facilitar a distribui- 
ção destas extensões, o pacote setuptools, na ausência do Pyrex, 
procura a versão em C gerada pelo autor do programa, e se ela esti- 
ver incluida na distribuição do programa, o setuptools passa então 
para a etapa de compilação e linkagem do código C. 


Listagem 5.10: Automatizando a compilação de extensões em 
Pyrex por meio do setuptools 





ll Disponivel no pacote de programas como: 


setupyx.py 
s|from setuptools import setup 
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Listagem 5.11: Utilizando Setuptools para compilar extensões em 
Pyrex 





1| import setuptools 
2| from setuptools.extension import Extension 














from setuptools.extension import Extension 


primespix = Extension (name = ’primespix’, 
sources = | ’primes.pyx 


‘| 
7 ) 


a a Ae O 


o| setup (name = ’primes’, 
10 ext modules = [primespix | 


11 ) 

















5.3 Integração com C++ 


A integração de programas em Python com bibliotecas em C++ é 
normalmente feita por meio ferramentas como SWIG (www. swig. 
org), SIP(www.riverbankcomputing.co.uk/sip/) ou Boost.Python 
(http://www.boost.org/libs/python/). Estas ferramentas, ape- 
sar de relativamente simples, requerem um bom conhecimento de 
C++ por parte do usuário e, por esta razão, fogem ao escopo deste 
capítulo. No entanto, o leitor que deseja utilizar código já escrito 
em C++ pode e deve se valer das ferramentas supracitadas, cuja 
documentação é bastante clara. 

Elegemos para esta seção sobre C++. uma ferramenta original. 
O ShedSkin. 
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Shedskin 


O ShedSkin (http: //shed-skin.blogspot.com/)se auto intitula 
“um compilador de Python para C++ otimizado”. O que ele faz , 
na verdade, é converter programas escritos em Python para C++, 
permitindo assim grandes ganhos de velocidade. Apesar de seu 
potencial, o ShedSkin ainda é uma ferramenta um pouco limitada. 
Uma de suas principais limitações, é que o programa em Python a 
ser convertido deve possuir apenas variáveis “estáticas”, ou seja as 
variáveis devem manter-se do mesmo tipo durante toda a execução 
do programa. Se uma variável é definida como um número inteiro, 
nunca poderá receber um número real, uma lista ou qualquer outro 
tipo de dado. 

O ShedSkin também não suporta toda a biblioteca padrão do 
Python na versão testada (0.0.15). Entretanto, mesmo com estas 
limitações, esta ferramenta pode ser muito útil. Vejamos um exem- 
plo: A integração numérica de uma função, pela regra do trapézio. 
Esta regra envolve dividir a área sob a função em um dado intervalo 
em multiplos trapézios e somar as suas áreas(figura 5.2. 

Matemáticamente, podemos expressar a regra trapezoidal da 
seguinte fórmula. 


n-1 
b-a 


b 
[flo de= (H+ 10) +H Fatih), h= 





(5.1) 


n 
Na listagem 5.12 podemos ver uma implementação simples da 
regra trapezoidal. 


Listagem 5.12: implementação da regra trapezoidal (utilizando laço 
for) conforme especificada na equação 5.3 





1||##-*-encoding: latin —1—*— 

2# Disponivel no pacote de programas como: 
trapintloop.py 

3| Æ copyright 2007 by Flávio Codeco Coelho 
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| 











4 o p 
a b 


Figura 5.2: Regra trapezoidal para integração aproximada de uma 
função. 


o o ND a A 








from time import clock 
from math import exp, log, sin 


def tint(a,b,fun): 
"uN 
Integração numérica pela regra 
trapezoidal 
meee 
n = 5000000 
h2 = (b-a) /(n*2.) 
res = h2«fun(a)+h2x«fun (b) 
for i in xrange(n): 
p = atix2*h2 
res += 2«h2«fun(p) 
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17 return res 


19||# Rodando as funcoes em Python 

2o|| start = clock () 

ar = tint (1.0,5.0 ,lambda(x):1+x) 

22|| stop = clock () 

23|| print 'resultado: %d\nTempo: %s seg ’%(r, stop 
—start ) 

al start = clock () 

ar = tint (1.0,5.0 ,lambda(x) : exp (xx**2x log (x+xx 
sin (x) ))) 

26|| stop = clock () 

27|| print ‘resultado: %d\nTempo: %s seg ’%(r, stop 
—start ) 

















Executando o script da Listagem 5.12 (trapintloop.py) obser- 
vamos o tempo de execução da integração das duas funções. 


Listagem 5.13: Executando a listagem 5.12 





$ python trapintloop .py 
resultado: 16 

Tempo: 11.68 seg 
resultado: 49029 
Tempo: 26.96 seg 


ao fF Ù N re 














Para converter o script 5.12 em C++ tudo o que precisamos fazer 


Listagem 5.14: Verificando o tempo de execução em C++ 





ıl $ ss trapintloop.py 

2|| xxx SHED SKIN Python-to-Ci+ Compiler 0.0.15 
2k 2K OK 

3|| Copyright 2005, 2006 Mark Dufour; License 
GNU GPL version 2 or later (See LICENSE) 
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10 
11 
12 
13 
14 
15 
16 
17 








(If your program does not compile, please 
mail me at mark. dufourQgmail.com !!) 


*WARNING* trapintloop:13: ’xrange’, ’ 
enumerate’ and ’reversed’ return lists 
for now 

[iterative type analysis..] 

ok x 

iterations: 2 templates: 55 

[generating c++ code..] 

$ make run 

g+ -03 -I 

./trapintloop 

resultado: 16 

Tempo: 0.06 seg 

resultado: 49029 

Tempo: 1.57 seg 
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Com estes dois comandos, geramos, compilamos e executamos 
uma versão C++ do programa listado em 5.12. O código C++ gerado 
pelo Shed-Skin pode ser conferido na listagem 5.15 
Como pudemos verificar, o ganho em performance é conside- 
rável. Lamentávelmente, o Shed-Skin não permite criar módulos 
“de extensão” que possam ser importados por outros programas em 
Python, só programas independentes. Mas esta limitação pode vir 
a ser superada no futuro. 


Listagem 5.15: Código C++ gerado pelo Shed-skin a partir do script 





trapintloopy.py 

ilfânclude "trapintloop.hpp" 
2 

3| namespace | trapintloop | + 
4 

s|| str *const 0; 
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6 
7|| double r, start, stop; 
8 
9 


double __lambda0__(double x) { 


11 return (1+x); 

12 } 

13 

14|| double __lambdal___ (double x) { 

15 

16 return exp (((x*x) «log ((x+(x*sin(x)))))); 

17|| } 

18 

i|| int — main() { 

20 const 0 = new str("resultado: %d\nTempo: 
%s seg"); 

21 

22 start = clock(); 

23 r = tint(1.0, 5.0, __lambda0__); 

24 stop = clock(); 

25 print("%s\n", __mod(const_0, __int(r), 
new float ((stop—start)))); 

26 start = clock(); 

27 r = tint(1.0, 5.0, __lambdal__); 

28 stop = clock(); 

29 print("%s\n", — mod(const 0, __int(r), 
new float ((stop-start)))); 

30 } 

31 

32|] /** 

33 Integração numérica pela regra 

trapeziodal 
34|| 4 / 











35||double tint (double a, double b, lambda0 fun) 
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double h2, p, res; 
int 0, 1, i, n; 


n = 5000000; 
h2 = ((b-a) /(n*2.0)); 
res = ((h2«fun(a))+(h2«*fun(b))) ; 


FAST A ae ee 

= (a+((i +2) *h2)) ; 

res += ((2*h2)*fun 
END_FOR 


(p)); 


return res; 


} 


} // module namespace 


int main(int argc, char **xargv) { 








__shedskin__:: __init(); 
math : init () ; 
time : init () ; 
“trapintloop  ::  main(); 
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5.4 Integração com a Linguagem Fortran 


A linguagem Fortran é uma das mais antigas linguagens de pro- 


gramação ainda em uso. 
foi projetada especificamente para aplicações científicas. 


Desenvolvida nos anos 50 pela IBM, 
A sigla 


Fortran deriva de “IBM mathematical FORmula TRANslation 
system”. Dada a sua longa existéncia, existe uma grande quan- 
tidade de código científico escrito em Fortran disponível para uso. 
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Felizmente, a integração do Fortran com o Python pode ser feita 
de forma extremamente simples, através da ferramenta f2py, que 
demonstraremos a seguir. 


f2py 


Esta ferramenta está disponível como parte do Pacote numpy (www. 
scipy.org). Para ilustrar o uso do f2py, vamos voltar ao problema 
da integração pela regra trapezoidal (equação 5.3). Como vimos, a 
implementação deste algoritmo em Python, utilizando um laço for, 
é ineficiente. Para linguagens compiladas como C++ ou Fortran, 
laços são executados com grande eficiência. Vejamos a performance 


de uma implementação em Fortran da regra trapezoidal (listagem 
TT): 


Listagem 5.16: implementação em Fortran da regra trapezoidal. 
label 





program trapezio 

intrinsic exp, log, sin 

real linear, nonl 

external linear 

external nonl 

call tint(1.0,5.0,linear ,res) 
print *, "Resultado: ",res 
call tint (1.0,5.0,nonl,res) 
print *, "Resultado: ",res 
end 


O o y QO ao A U Hm 


=. e H 
Nu oF o 


subroutine tint (a,b,fun, res) 
real a, b,res 

integer *8 n 

real h2, alfa 

real fun 

external fun 


Boe BP p 
a mB WwW 











= 
q 
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18 n = 5000000 

19] Cf2py intent (in) a 

2|| Cf2py intent (in) b 

|| Cf2py intent(in) fun 

22|| Cf2py intent (out, hide, cache) res 
23 h2 = (b-a) /(2*n) 

24 alfa=h2«fun(a)+h2*fun(b) 
25 res —0.0 

26 do i=1,n 

27 p = atix2*h2 

28 res = res+2xh2«fun(p) 
29 end do 

30 res = res+alfa 

31 return 

32 end 

33 

34 real function linear (x) 
35 real x 

36|| Cf2py intent (in,out) x 

37 linear = x+1.0 

38 return 

39 end 

40 

41 real function nonl(x) 

42 real x 

43|| Cf2py intent (in ,out) x 

44 nonl = exp(x**2*log (x+x*sin(x))) 
45 return 

46 end 

















A listagem 5.17 nos mostra como compilar e executar o código 
da listagem ??. Este comando de compilação pressupõe que você 
possua o GCC (Gnu Compiler Collection) versão 4.0 ou superior. 
No caso de versões mais antigas deve-se substituir gfortran por 
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g77 ou f77. 


Listagem 5.17: Compilando e executando o programa da listagem 
22 





ıl $ gfortran —o trapint trapint.f 
2\|$ time ./trapint 

3|} Resultado: 16.01428 

all Resultado: 48941.40 

5 

e|| real 0m2.028s 

7|| user 0m1.712s 

s|| sys 0m0.013s 

















Como em Fortran não temos a conveniência de uma função 
para “cronometrar” nossa função, utilizamos o comando time do 
Unix. Podemos constatar que o tempo de execução é similar ao 
obtido com a versão em C++ (listagem 5.15). 

Ainda que não seja estritamente necessário, é recomendável 
que o código Fortran seja preparado com comentários especiais 
(Cf2py), antes de ser processado e compilado pelo f2py. A lista- 
gem ?? já inclui estes comentários, para facilitar a nossa exposição. 
Estes comentários nos permitem informar ao f2py as variáveis de 
entrada e saída de cada função e algumas outras coisas. No exemplo 
??, os principais parametros passados ao f2py, através das linhas 
de comentário Cf2py intent (), são in, out, hide e cache. As 
duas primeiras identificam as variáveis de entrada e saída da fun- 
ção ou procedure. O parâmetro hide faz com que a variável de 
saída res, obrigatoriamente declarada no cabeçalho da procedure 
em Fortran fique oculta ao ser importada no Python. O parâme- 
tro cache reduz o custo da realocação de memória em variáveis que 
são redefinidas dentro de um laço em Fortran. 

Antes que possamos “importar” nossas funções em Fortran para 
uso em um programa em Python, precisamos compilar nossos fontes 
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em Fortran com o f2py. A listagem 5.18 nos mostra como fazer 
isso. 


Listagem 5.18: Compilando com f2py 





a 


$ f2py m trapintf —c trapint.f 














Uma vez compilados os fontes em Fortran com o f2py, pode- 
mos então escrever uma variação do script trapintloop.py (lis- 
tagem 5.12) para verificar os ganhos de performance. A listagem 
5.19 contém nosso script de teste. 


Listagem 5.19: Script para comparação entre Python e Fortran 
via f2py 





1||##-*-encoding: latin —1—*— 

24% Disponivel no pacote de programas como: 
trapintloopcomp .py 

3| from time import clock 

4| from math import exp, log, sin 

s| from trapintf import tint as ftint, linear, 





nonl 
6| def tint(a,b,f): 
7 n = 5000000 
8 h2 = (b-a) /(n*2.) 
9 res = h2«f(a)+h2«f(b) 
10 for i in xrange(n): 
11 p = atix*2*h2 
12 res += 2«xh2«f(p) 
13 return res 


14| # Rodando as funcoes em Python 

is}, start = clock () 

1l r = tint (1,5 ,lambda(x):1+x) 

mr] stop = clock () 

18| print ‘resultado: %d\nTempo: %s seg ’%(r , stop 
—start ) 
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19|| start = clock () 

or = tint (1,5 ,lambda(x) : exp (x**2«*log (x+x*sin ( 
x)))) 

ai|| stop = clock () 

2|| print 'resultado: %d\nTempo: %s seg ’%(r, stop 


—start ) 

23| #Rodando as funções em Fortran chamando 
Python 

24|| print "tempo do Fortran com funcoes em 
Python" 


as start = clock () 

ar = ftint (1. ,5.,lambda(x):1+x) 

27|| print "resultado: %d\nTempo: %s seg ’%(r, 
clock ()—start ) 

as|| start = clock () 

ar = ftint (1.,5. ,lambda(x) :exp(x**2*log (x+xx 
sin (x)))) 

30|| print "resultado: %d\nTempo: %s seg ’%(r, 
clock ()—start ) 

31| #Rodando as funções em Fortran puro 

32|| print "tempo do Fortran com funcoes em 
Fortran" 

ss start = clock () 

ar = ftint (1.,5.,linear) 

35|| print ’resultado: %d\nTempo: %s seg ’%(r, 
clock ()—start ) 

se start = clock () 

37| r = ftint (1.,5.,nonl) 

ss| print ’resultado: %d\nTempo: %s seg ’%(r, 
clock ()-start) 

















A listagem 5.19 contem uma versão da regra trapezoidal em 
Python puro e importa a função tint do nosso programa em Fortran. 
A função em Fortran é chamado de duas formas: uma para inte- 
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grar funções implementadas em Python (na forma funções lambda) 
e outra substituindo as funções lambda pelos seus equivalentes em 
Fortran. 

Executando trapintloopcomp.py, podemos avaliar os ganhos 
em performance (listagem 5.20). Em ambas as formas de utilização 
da função ftint, existem chamadas para objetos Python dentro 
do laço DO. Vem daí a degradação da performance, em relação à 
execução do programa em Fortran, puramente. 


Listagem 5.20: Executando trapintloopcomp.py 





$ python trapintloopcomp .py 

resultado: 16 

Tempo: 13.29 seg 

resultado: 49029 

Tempo: 29.14 seg 

tempo do Fortran com funcoes em Python 
resultado: 16 

Tempo: 7.31 seg 

resultado: 48941 

Tempo: 24.95 seg 

tempo do Fortran com funcoes em Fortran 
resultado: 16 

Tempo: 4.85 seg 

resultado: 48941 

Tempo: 6.42 seg 


O o NHN Det A U N e 
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Neste ponto, devemos parar e fazer uma reflexão. Será justo 
comparar a pior implementação possível em Python (utilizando 
laços for), com códigos compilados em C++ e Fortran? Realmente, 
não é justo. Vejamos como se sai uma implementação competente 
da regra trapezoidal em Python (com uma ajudinha do pacote 
numpy). Consideremos a listagem 5.21. 





Listagem 5.21: Implementação vetorizada da regra trapezoidal 
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Noe 
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21 








#—*— encoding: latin —1—*— 

# Disponivel no pacote de programas como: 
trapintvect.pt 

from numpy import x 

from time import clock 


def tint(a,b,fun): 


if 


name == main 
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wan 


Integração numérica pela regra 


trapezoidal 
man 
n = 5000000. 
h = (b-a)/n 


res = h/2xfun(a)+h/2x fun (b)+hxsum( 
fun (arange(a,b,h))) 
return res 


3 a 





start = clock() 

r = tint (1,5 ,lambda(x):1+x) 

print ‘resultado: %d\nTempo: %s seg’ 
%(r , clock ()-start) 

start = clock() 

r = tint (1,5 ,lambda(x) : exp (x**2x«log ( 
x+x*sin(x)))) 

print ‘resultado: %d\nTempo: %s seg’ 
%(r , clock ()-start) 











Executando a listagem 5.21, vemos que a implementação veto- 
rizada em Python ganha (0.28 e 2.57 segundos)de nossas soluções 
utilizando f2py. 

Da mesma forma que com o Pyrex, podemos distribuir progra- 
mas escritos em Python com extensões escritas em Fortran, com 
a ajuda do pacote setuptools. Na listagem 5.22 vemos o exem- 
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plo de como escrever um setup.py para este fim. Neste exemplo, 
temos um setup.py extrememente limitado, contendo apenas os 
parâmetros necessarios para a compilação de uma extensão deno- 
minada flib, a partir de uma programa em Fortran, localizado no 
arquivo flib.f, dentro do pacote “meupacote”. Observe, que ao 
definir módulos de extensão através da função Extension, podemos 
passar também outros argumentos, tais como outras bibliotecas das 
quais nosso código dependa. 


Listagem 5.22: setup.py para distribuir programas com extensões 
em Fortran 





1|| import ez setup 

alez setup.use setuptools() 

3|| import setuptools 

4| from numpy. distutils. core import setup, 

Extension 

s|| flib = Extension (name='meupacote. flib ’, 

6 libraries =], 

7 library_dirs=[], 

8 f2py_options=[], 

9 sources=|’meupacote/ 
flib.f’] 

10 ) 

n| setup (name = ’mypackage’ , 

12 version = ’0.3.5’, 

13 packages = [| ’meupacote’], 

14 ext modules = [flib | 

15 ) 
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5.5 A Piton que sabia Javanês — Integração 
com Java 


Peço licença ao mestre Lima Barreto, para parodiar o título do seu 


excelente conto, pois não pude resistir à analogia. A linguagem 
Python, conforme descobrimos ao longo deste livro, é extrema- 
mente versátil, e deve esta versatilidade, em parte, à sua biblioteca 
padrão. Entretanto existe uma outra linguagem que excede em 
muito o Python (ao menos atualmente), na quantidade de módu- 
los disponíveis para os mais variados fins: o Java. 

A linguagem Java tem, todavia, contra si uma série de fatores: 
A complexidade de sua sintaxe rivaliza com a do C++, e não é efi- 
ciente, como esperaríamos que o fosse, uma linguagem compilada, 
com tipagem estática. Mas todos estes aspectos negativos não são 
suficientes para anular as vantagens do vasto número de bibliotecas 
disponíveis e da sua portabilidade. 

Como poderíamos capturar o que o Java tem de bom, sem levar 
como “brinde” seus aspectos negativos? É aqui que entra o Jython. 

O Jython é uma implementação completa do Python 2.2! em 
Java. Com o Jython programadores Java podem embutir o Python 
em seus aplicativos e applets e nós, programadores Python, pode- 
mos utilizar, livremente, toda (ou quase toda) a biblioteca padrão 
do Python com classes em Java. Além destas vantagens, O Jython 
também é uma linguagem Open Source, ou seja de código aberto. 


O interpretador Jython 


Para iniciar nossa aventura com o Jython, precisaremos instalá-lo, 
e ter instalada uma máquina virtual Java (ou JVM) versão 1.4 ou 
mais recente. 





1O desenvolvimento do Jython continua, mas não se sabe ainda 
quando alcançará o CPython (implementação em C do Python). 
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Vamos tentar usá-lo como usaríamos o interpretador Python e 
ver se notamos alguma diferença. 


Listagem 5.23: Usando o interpretador Jython 





ıl $ jython 
2|| Jython 2.1 on javal.4.2—01 (JIT: null) 
3| Type "copyright", "credits" or "license" for 


more information. 
>>> print "hello world’ 


4 

s|| hello world 

s| >>> import math () 

7||>>> dir (math) 

sl [ acos’, ‘asin’, ’atan’, ’atan2’, ’ceil’, ’ 
classDictInit’, ’cos’, ’cosh’, ’e’, “exp 
>, ° fabs’, ’floor’, ’fmod’, ’frexp’, ’ 
hypot’, ’ldexp’, ’log’, ’log10’, ’modf’, 
“pi”, 'pow'”, “sin”, ’sinh’, ’sqrt’, ’ 
tan’, ‘tanh’ ] 


>>> math. pi 
10| 3.141592653589793 


o 

















Até agora, tudo parece funcionar muito bem. Vamos tentar um 
exemplo um pouco mais avançado e ver de que forma o Jython 
pode simplificar um programa em Java. 


Listagem 5.24: Um programa simples em Java usando a classe 
Swing. 





import javax.swing.JOptionPane; 
class testDialog { 


=. 


N 


3 public static void main ( String [| args ) 
t 
4 javax. swing. JOptionPane. 


showMessageDialog ( null, "Isto e 
um teste." ); 
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A versão apresentada na listagem 5.24 está escrita em Java. 
Vamos ver como ficaria a versão em Jython. 


Listagem 5.25: Versão Jython do programa da listagem 5.24. 





>>> import javax.swing.JOptionPane 
>>> javax. swing. JOptionPane. 
showMessageDialog (None,"Isto e um teste. 


te) 


Podemos observar, na listagem 5.25, que eliminamos a verbor- 
ragia característica do Java, e que o programa em Jython ficou 
bem mais “pitônico”. Outro detalhe que vale a pena comentar, é 
que não precisamos compilar (mas podemos se quisermos) o código 
em Jython, como seria necessário com o Java. Só isto já é uma 
grande vantagem do Jython. Em suma, utilizado-se o Jython ao 
invés do Java, ganha-se em produtividade duas vezes: Uma, ao 
escrever menos linhas de código e outra, ao não ter que recompilar 
o programa a cada vez que se introduz uma pequena modificação. 

Para não deixar os leitores curiosos acerca da finalidade do có- 
digo apresentado na listagem 5.25, seu resultado encontra-se na 
figura 5.3. 


= 


N 














Criando “Applets” em Jython 


Para os conhecedores de Java, o Jython pode ser utilizado para 
criar “servlets”, “beans” e “applets” com a mesma facilidade que 
criamos um aplicativo em Jython. Vamos ver um exemplo de “ap- 
plet”(listagem 5.26). 


Listagem 5.26: Criando um applet em Jython 





| import java.applet. Applet; 
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Figura 5.3: Saida da listagem 5.25. 


2|| class appletp ( java.applet. Applet ): 

3 def paint ( self, g ): 

4 g.drawString ( ‘‘Eu sou um Applet 
Jython!’’, 5, 5) 








Para quem não conhece Java, um applet é um mini-aplicativo 
feito para ser executado dentro de um Navegador (Mozilla, Opera 
etc.) que disponha de um “plug-in” para executar código em Java. 
Portanto, desta vez, precisaremos compilar o código da listagem 
5.26 para que a máquina virtual Java possa executá-lo. Para isso, 
salvamos o código e utilizamos o compilador do Jython, o jythonc. 


Listagem 5.27: Compilando appletp.py 








$ jythonc deep core —j appletp.jar 
appletp.py 
processing appletp 


nm 


Required packages: 
java. applet 


Creating adapters: 











O o | Doe w N 


Creating .java files: 
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10 appletp module 
11 appletp extends java.applet.Applet 


13|| Compiling .java to .class... 

u|| Compiling with args: [’/opt/blackdown—jdk 
—1.4.2.01/bin/javac’, ’-classpath’, ’/ 
usr/share/jython/lib/jython —2.1.jar:/usr 
/share/libreadline —java/lib /libreadline — 
java.jar:.:./jpywork::/usr/share/jython/ 
tools /jythonc: /home/fccoelho /Documents / 
LivroPython /.:/usr/share/jython/Lib’, 
’./jpywork/appletp.java’| 

15//0 Note: ./jpywork/appletp.java uses or 
overrides a deprecated API. 

16|| Note: Recompile with —deprecation for 
details. 


18|| Building archive: appletp.jar 
19|| Tracking java dependencies: 

















Uma vez compilado nosso applet, precisamos “embuti-lo” em 
um documento HTML (listagem 5.28. Entao, basta apontar nosso 
navegador para este documento e veremos o applet ser executado. 


Listagem 5.28: Documento HTML contendo o “applet”. 


<html> 

<head> 

3|} <meta content="text/html; charset-ISO 

—8859—1" 

http—equiv="content—type"> 
<title>jython applet</title> 

</head> 

<body> 

Este 





=. 


N 
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&eacute; o seu applet em Jython:<br> 

<br> 

<br> 

<center> 

<applet code="appletp" archive="appletp.jar" 
name="Applet em Jython" 

alt="This browser doesn’t support JDK 1.1 
applets." align="bottom" 

height="50" width="160"> 

<PARAM NAME" codebase" VALUE=". "> 

<h3>Algo saiu errado ao carregar 

este applet.</h3> 

</applet> 

</center> 

<br> 

<br> 

</body> 

</html> 














Na compilação, o código em Jython é convertido completa- 


mente em código Java e então compilado através do compilador 
Java padrão. 


5.6 Exercícios 


1. Compile a listagem 5.1 com o Shed-skin e veja se há ganho de 
performance. Antes de compilar, remova as linhas associadas 
ao uso do Weave. 


2. Após executar a função primes (listagem 5.6), determine o 


tamanho da lista de números primos menor do que 1000. 
Em seguida modifique o código Pyrex, declarando a variável 
results como uma lista de inteiros, e eliminando a função 
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CAPITULO 5. INTERAGINDO COM OUTRAS 
LINGUAGENS 


append do laco while. Compare a performance desta nova 
versão com a da versão original. 


Parte II 


Aplicando o Python a 
Problemas Cientificos 
Concretos 
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Capitulo 6 


Modelagem Matematica 


Introdução à modelagem matemática e sua implementa- 
ção computacional. Discussão sobre a importância da 
Análise dimensional na modelagem e apresentação do 
pacote Unum para lidar com unidades em Python. Pré- 
requisitos: Conhecimentos básicos de cálculo. 


A construção de modelos é uma etapa imprescindível, na ca- 
deia de procedimentos normalmente associada ao método científico. 
Modelos matemáticos são uma tentativa de representar de forma 
lógico / quantitativa, mecanismos que observamos na natureza. 

Todo modelo é por definição falso. O modelo é um instrumento 
de organização de idéias e hipóteses. Como tal, o modelo bom é 
aquele que representa bem nossas idéias. O que o fará útil para o 
conhecimento do mundo, dependerá, em grande parte, da qualidade 
de nossa concepção de mundo. Assim, bons modelos exigem uma 
boa compreensão do sistema a ser modelado. Alguém pode estar 
pensando: Se é preciso conhecer bem para modelar, então para 
que modelar, se o objetivo for conhecer bem? O grande segredo da 
modelagem é que o ato de modelar é, em si, um ato de conhecer. 
Isto é, para criar um modelo, o autor precisa escrutinar todo o 
seu conhecimento do sistema-alvo: identificar seus componentes, 
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A 


discriminar o que é relevante do que não é, hipotetizar sobre as 
relações causais que regem os processos observados, etc. 

Ao se deter nestes detalhes, começam a surgir os vazios do co- 
nhecimento, buracos a serem preenchidos com experimentos e ob- 
servações ainda não pensados. Do mesmo modo, observações e in- 
tuições que antes não faziam muito sentido, começam a se encaixar 
melhor... 

Muitas vezes, o resultado final de um modelo parece tão óbvio, 
que nos perguntamos para que serviu. No entanto, o óbvio só se 
tornou óbvio, por causa do ato de modelar. 


“E aquilo que neste momento se revelará aos povos, não 
surpreenderá a todos por ser exótico, mas pelo fato de 
ter sempre estado oculto, quando terá sido, o óbvio” 


Caetano Veloso 


Outras vezes, os modelos abrem novas avenidas de escrutínio, 
ao apontar para fenômenos pouco intuitivos (como o caos determi- 
nístico). 

Para matematizar um modelo, existem dois pontos de partida. 
Podemos construir do zero ou pegar emprestado. Pegar emprestado 
significa adaptar um modelo proposto por alguém. A vantagem de 
pegar emprestado é que o modelo já vem com alguma bagagem 
analítica. A desvantagem é que ele tolhe a nossa liberdade cri- 
ativa. Ao olharmos para a história da modelagem, encontramos 
alguns modelos que ficaram de tal forma inseridos no imaginário 
do modelador que parecem ser os únicos existentes. Um exemplo 
é o modelo de Lotka-Volterra. Ele é tão usado, que as vezes se 
torna difícil escrever alguma coisa nova sem, inconscientemente, 
comparar o modelo novo com este padrão. 

Modelos, embora falsos, devem ser corretos. Existem dois ní- 
veis de correção de um modelo matemático: modelos devem ter 
coerência lógica (isto é, não se pode somar alhos com bugalhos) e 
coerência com o modelo mental proposto (isto é, ele deve represen- 
tar aquilo que o autor quer dizer). 
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Computacionalmente falando, modelos são como máquinas trans- 
formadoras, produzem informação a partir de informação. São 
equivalentes, portanto, a funções que, a partir de argumentos, pro- 
duzem um resultado que consiste na transformação do argumento 
de entrada, de acordo com o mecanismo codificado dentro de si. 

Vamos começar nossa jornada, em direção à representação com- 
putacional de modelos matemáticos, com uma breve introdução ao 
modelos mais simples e suas implementações. 


6.1 Modelos 


Lineares 


Modelos lineares representam a relação entre grandezas que variam 
de forma proporcional. Um exemplo simples é o da corrida de 
taxi. O valor pago ao motorista numa corrida de taxi é calculado 
em função da quilometragem rodada, mais o valor da bandeirada 
inicial. Digamos que João cobre 0.50 reais por quilômetro rodado e 
uma bandeirada de 2,00. Se rodarmos 10km, pagaremos 0.5x10 = 
5 reais (+ a bandeirada); se rodarmos o dobro (20km), pagaremos 
o dobro pela corrida (10 reais) + bandeirada. As duas grandezas - 
quilometragem rodada e valor pago pela quilometragem - variam de 
forma proporcional. Vamos supor que João tenha um caderno onde 
ele registra todas as corridas que faz, incluindo quilometragem, 
valor pago pela quilometragem e valor total pago (quilometragem 
+ bandeirada). 

Se fizermos um diagrama de dispersão com os dados da tabela 
6.1, obteremos uma reta representando o cenário sem bandeirada 
e outra para o cenário com bandeirada. 

O cálculo da corrida final é feito pela equação: 


R$=ax Km+b 
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Tabela 6.1: Valor de corridas de taxi 








corrida km valor /kilometragem valor total 
1 5 2,50 4,50 
2 8 4,00 6,00 
3 1,50 3,50 
4 10 5,00 7,00 
5 9 4,50 6,50 
6 2,00 4,00 
7 15 7,50 9,50 





onde a é o valor pago por quilômetro rodado (a = 0,50) e bé o 
valor inicial pago (isto é, a bandeirada). Em Python: 


1 >>> def taxi(tarifa ,km, band=2): 
2 return tarifa+kmtband 

3 >>> pr = taxi(0.5,10) 

4 >>> pr 

5 7.0 


Vamos ver outros exemplos: 

Crescimento populacional por imigração constante. Uma po- 
pulação é composta inicialmente por 100 indivíduos. A partir do 
ano que chamaremos 0, passaram a chegar 10 novos indivíduos por 
ano. Esta população crescerá, isto é, terá 110 indivíduos no ano 
1, 120 indivíduos no ano 2, 130 indivíduos no ano 3, etc. Se nós 
fizermos um gráfico da relação ano x número de indivíduos, tere- 
mos uma reta crescente. Esta reta intercepta o eixo vertical no 
ponto 100 (população inicial) e tem inclinação dada pelo número 
de individuos acrescidos por unidade de tempo (isto é, a = 10). 

Decrescimento populacional por emigração constante. Agora, 
suponha que ao invés de entrar, estão saindo 10 indivíduos a cada 
ano. Se a população é composta inicialmente por 100 indivíduos, 
então teremos 90 indivíduos no ano 1; 80 indivíduos no ano 2; 70 
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19.00 —€— valor pago pela corrida (sem bandeirada) 
900 —4— valor pago pela corrida (com bandeirada) + 
8.00 
2 
7.00 
6.00 << 
R$ =0.5 km +2 R$ = 0.5 km 

æ 800 
a 

4.00 : 

12,5 

3.00 a a= 2,5/5= 0,5 

2.00 4” 5 F 

1.00 0 1 a= 0,5/1= 0,5 





0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 


corrida (km) 


Figura 6.1: Diagrama de dispersão do exemplo do taxi. A reta 
superior descreve o cenário com bandeirada e a inferior, sem ban- 
deirada. 


indivíduos no ano 3, etc. Se nós fizermos um gráfico da relação 
entre ano e número de indivíduos, teremos uma reta decrescente. 
Esta reta intercepta o eixo vertical no ponto 100 (população inicial) 
e tem inclinação negativa, cujo valor absoluto é dado pelo número 
de individuos perdidos por unidade de tempo (isto é, a = —10). 


Todos os exemplos dados são especificações de modelos cujo 
formato geral é: 
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200 jo) 


we 


N (numero de individuos) 





valor inicial 


Figura 6.2: População crescendo de forma linear, devido à chegada 
de um número constante de novos indivíduos por ano. 


Y=axX+b 


onde a, chamado de coeficiente angular, é a taxa de variação da 
grandeza Y por unidade de X e b, chamado de coeficiente linear, é 
o valor de Y quando X = 0. Este modelo se expressa graficamente 
como uma reta com ângulo a em relação a linha horizontal e que 
cruza o eixo vertical no ponto b. Esta reta será crescente se a 
for maior do que 0; horizontal, se a = 0, e decrescente, se a for 
negativo. 
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80 Ns N=-10t+ 100 


60 oe 


D 


eb: TR -20/2=-10 
40 abissansa readies O. 
i 2 N 


N (número de indivíduos) 





t (ano) 


Figura 6.3: População diminui de forma linear, devido à saida de 
um número constante de indivíduos por ano. 


Propriedades Uma propriedade importante do modelo linear é 
que a variação de crescimento ou decrescimento é constante e in- 
dependente do valor de X. No caso da imigração, por exemplo, 
estavam entrando 10 pessoas todos os anos, independentemente do 
número de pessoas já existentes na população. No caso do taxi, o 
valor pago por quilômetro rodado não mudava se a pessoa já tivesse 
rodado 5 ou 20 km. 
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y=2Xx 


y=0x 











Figura 6.4: Representação gráfica de um modelo linear. Efeito do 
parametro a. 


Exponenciais 


O modelo linear descrito na seção anterior, pode ser um bom mo- 
delo para descrever o crescimento de uma populacao por imigracao 
constante. Porém, não nos serve para descrever o crescimento por 
reprodução. Vejamos o clássico exemplo do crescimento bacteriano 
por bipartição. Digamos que temos uma população com uma bac- 
téria no tempo t=0. Após 1 hora, cada bactéria se divide e forma 
duas bactérias-filha. Estas duas bactérias geram 4 novas bactérias 
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Y=aX 
Y=ax+5 


Y=aX-5 











Figura 6.5: Representação gráfica de um modelo linear. Efeito do 
parâmetro b. 


em mais uma hora e assim por diante. Se fizermos um gráfico do 
número de bactérias na população, teremos algo como a figura 6.6. 

Veja que o número de novos indivíduos a cada geração não é 
constante, como no modelo linear. Agora, ele aumenta de forma 
geométrica. Na primeira geração foram 2 novos indivíduos, na 
segunda geração foram 4 e assim por diante. O crescimento é muito 
mais acelerado e parece tender para uma explosão demográfica! Em 
apenas 10 horas, teremos uma população com 1024 indivíduos e, 
em um dia, 16.677.216 bactérias! 
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N (número de bactérias) 








Figura 6.6: Crescimento de uma população de bactérias por bipar- 
tição. 


No entanto, embora o crescimento não seja constante no tempo, 
ele é constante por indivíduo. O que isso quer dizer? Cada indiví- 
duo na população contribui com o mesmo número de filhos para a 
geração seguinte,de forma que uma população pequena gerará um 
número menor de “filhotes” do que uma população grande. 


Este tipo de crescimento dependente do número de indivíduos 
presentes é chamado de exponencial, pelo fato da variável indepen- 
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dente estar no expoente. Matematicamente, ele tem o formato: 
Y = wB* 


onde w é o número inicial de bactérias (w = 1). 

Ao contrário do modelo linear, onde a taxa de variação era 
independente do número de indivíduos presentes, no modelo ex- 
ponencial, a taxa de variação é uma função, isto é, depende, do 
número de indivíduos presentes. 


6.2 Construindo Modelos Dinâmicos 


Na seção anterior vimos como representar fenômenos simples como 
expressões matemáticas. Agora vamos explorar representações mais 
sofisticadas: Vamos modelar processos dinâmicos. Processos dina- 
micos modificam-se em função de uma variável independente que, 
nos casos mais comuns, pode ser o tempo ou o espaço. 

Nos modelos estáticos da seção anterior, buscamos expressar o 
estado do sistema em função de outras variáveis. Uma vez deter- 
minado os valor destas variáveis, o estado do sistema permanece 
inalterado. Agora, não sabemos o que determina o estado do sis- 
tema, necessáriamente, mas podemos descrever mecanismos que 
alteram um estado inicial dado. 

Neste tipo de modelagem utilizamos equações de diferença(variável 
independente discreta) ou diferenciais (variável independente con- 
tínua), para modelar a taxa de variação do sistema, representada 
pelas chamadas variáveis de estado. 


Modelando Iterativamente 


Vamos começar a explorar os modelos dinâmicos, através de mo- 
delos com dinâmica temporal discreta. Neste caso, podemos repre- 
sentar o tempo discreto como a execução iterativa de uma função. 


146 CAPÍTULO 6. MODELAGEM MATEMÁTICA 

















16000 7 1.0000, - — 
* «Adultos o + «População 
á ACriancas 
14000} sado! 
12000} 
8000} 
10000} 
l 7000} 
8000fa pA 
a 6000} x 
6000}, : >, 
K 
4 5000} 
4000F» 
2000}. 4000F 
0 

















o 20 40 60 80 100000 20 40 60 80 


100 
tempo tempo 


Figura 6.7: Modelos populacionais discretos. Modelo 2 à esquerda 
e modelo 1 à direita. 


Na listagem 6.1, vemos dois modelos populacionais: 


Modelo1l: Niyi =N+rNe—-mN,+Hi-—eN, 





Cu = CtrÃ—-mCO,—el, 
Modelo 2: { Ay cat e 

No modelo 1, temos o tamanho da populacao no tempo seguinte 
(N++1) sendo expresso como uma alteração da população atual pelo 
nascimento de indivíduos a uma taxa r, pela mortalidade (m), e 
por fluxos migratórios (eN; e i). 

No modelo 2, temos uma demografia similar, porém agora com 
a população dividida em dois grupos: crianças (C+) e adultos (A+). 
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Nestes modelos, utilizamos um simples laço for para resolver 
numericamente as equações de diferença. Representações recursi- 
vas também seriam possíveis, mas para este exemplo não são ne- 
cessárias. 


Listagem 6.1: Dois modelos discretos de crescimento populacional 





ıl Æ Disponivel no pacote de programas como: 
modelo. py 

2| #—*—encoding : latin —1—*— 

3| from pylab import x 

4 

5||N = [10000] #serie temporal de populacao 

6//n0 = 10000 populacao inicial 

z| t = 100 tperiodo de tempo da 
simulacao 

sr = 0.02 #natalidade 

sim = 0.03 #taxa de mortalidade 

10| im = 0 #taxa de imigração 

njjem = 0 #taxa de emigração 

12| parâmetros modelo? 

ssme = 0.01 #taxa de mortalidade 
infantil 

14//ma = 0.01 #taxa de mortalidade adulta 

sra = 0.02 #taxa de reproducao 

16l e = 0.1 #taxa de envelhecimento 

17) C = [10000] #serie temporal de crianças 

is|/A = [0] #serie temporal de adultos 

19| a0 = 0 #populacao inicial de 
adultos 

20|| c0 = 10000 #populacao inicial de 
criancas 

21 

22| def Modelo (n0): 

23 nf = n0 + r+*n0 —m*n0 +im —em*n0 
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24 N.append (nf) 
25 return nf 
26 


27|| def Modelo2(c0 ,a0): 





28 cf = c0 + raxa0 —mcxc0 —exc0 
29 af = a0 + exc0 — maxa0 

30 C.append(cf) 

31 A.append(af) 

32 return cf ,af 


33 
al for i in xrange(t): 

35 c0,a0 = Modelo2(c0 ,a0) 
36 n0 = Modelo (n0) 

37 
38|| subplot (121) 

so) plot (A,’.’, C,’r*’) 

4o|| legend ([ ’Adultos’,’Criancas’]) 
ajl xlabel (“tempo”) 

42|| subplot (122) 

43|| plot (N,’.’) 

44|| legend ([u’ População’ ]) 

45|| xlabel (“tempo”) 

46|| savefig (’pop.png’ ,dpi=400) 

47|| show () 

















Integração Numérica 


A simulação de modelos onde a variável independente é contínua, é 
técnicamente mais complexa. Por isso, neste caso, lançaremos mão 
do pacote scipy!. 





Inttp://wuu.scipy.org 
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Modelos dinâmicos contínuos são comumente representados por 
sistemas de equações diferenciais ordinárias, e sua resolução envolve 
a integração destas numericamente. 

O pacote scipy contém um pacote dedicado à integração nu- 
mérica de equações diferenciais: o integrate. 


1 In [1]:from scipy import integrate 


Nesta seção utilizaremos o pacote integrate para resolver um 
sistema de equações diferenciais ordinárias bem simples: 


d 
ad = rP—pPQ (6.1) 
dQ 


O sistema de equações 6.2, representa a dinâmica de duas popu- 
lações, P e Q onde Q(predador) alimenta-se de P (presa). Em nossa 
implementação, utilizaremos a função odeint do pacote integrate’. 
Esta função tem como argumentos uma função que retorna as de- 
rivadas, a partir das condições iniciais, e um vetor de valores da 
variável independente(t) para os quais os valores das variáveis de 


estado serão calculados. 


Listagem 6.2: Integrando um sistema de equações diferenciais or- 
dinárias 





1||##modelo_ode.py 

24% Disponivel no pacote de programas como: 
modelo ode.py 

3|| ##-*-en coding : utf -8-+— 

4| from scipy import integrate 





2A função odeint encapsula a tradicional biblioteca 1soda implementada em 
Fortran. Esta biblioteca determina dinâmicamente o algoritmo de integração 
mais adequado a cada passo de integração, selecionando entre o método de 
Adams e o BDF. 
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s|| from numpy import x 

e| import pylab as P 

7 

sil class Model: 

9 def _ init (self ,equations ,inits , 

trange ,): 

10 meee 

11 Equations: Lista com as equações 

diferenciais na forma de strings 

12 inits: sequencia de condições 

iniciais 

13 trange: extensão da simulação 

14 meee 

15 self.eqs = equations 

16 

17 self.Inits = inits 

18 self.Trange = arange(0,trange ,0.1) 

19 self .compileEqs () 

20 

21 def compileEqs(self): 

22 "uN 

23 Compila as equações. 

24 "uN 

25 try: 

26 self .ceqs = [compile(i ,’< 
equation>’,’eval’) for i in 
self .eqs] 

27 except SyntaxError: 

28 print 'Há um erro de sintaxe nas 
equações ,\nConserte—o e 
tente novamente 

29 

30 def Run( self): 

31 meee 
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32 Faz a integração numérica. 

33 man 

34 t courseList = [] 

35 t courseList.append(integrate. odeint 
(self. Equations , self. Inits , self. 
Trange)) 

36 return (t_courseList , self. Trange) 

37 

38 def Equations(self ,y,t): 

39 man 

40 Define os sistema de EDOs calculando 
cada equacao 

41 com base no valor anterior e 


retornando as derivadas. 


42 nun 








43 &-—Cria vetor de equações 

44 eqs = self. ceqgs 

45 Neq=len (eqs) 

46 ydot = zeros ((Neq) ,’d’) 

47 for k in xrange (Neq): 

48 ydot[k] = eval(eqs[k]) 

49 return ydot 

50 

sıl if name ==" main ": 

52 inits = [1,1] 

53 eqs = [’3.0*y[0]—2.0*y[O]*y[1]’,’—-2.0*y 
[1]+y[0]*y[1] °] 

54 ODE = Model(eqs ,inits ,10) 

55 y,t = ODE. Run() 

56 #print y 

57 P.plot (t,y[O][: ,0], "v=" ytyy [0] [54] 4°90 
=] 











58 P.legend (| Presa’ ,’ Predador’ ]) 
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P. savefig(’lv.png’ ,dpi=400) 
P. show () 


59 


60 














O modelo é implementado como uma classe. A implementação 
poderia ser mais simples, até mesmo feita diretamente do console do 
Python. Entretanto, esta implementação mais longa nos permite 
apresentar algumas outras técnicas interessantes. 

O modelo é definido durante a inicialização do objeto, através de 
atributos obrigatórios. Um método Run() é utilizado para executar 
a integração numérica. É neste método que chamamos a função 
odeint, passando os argumentos requeridos, a saber: a função que 
implementa as equações, os valores iniciais das variáveis de estado 
e o vetor de tempos. 

À equações são passadas pelo usuário na forma de strings. Estas 
strings devem conter uma expressão Python válida. 

O método Equations precisa combinar as expressões das equa- 
ções para poder calcular o valor das derivadas em cada ponto do 
tempo. Por isso, uma notação de lista foi utilizada para permitir 
referências entre as equações. Desta forma, cada variável de estado 
é um elemento da lista y. 

As expressões representando as equações, são interpretadas por 
meio da função eval, a cada passo da integração numérica. Isto 
requer que as strings contendo as expressões, sejam compiladas 
para byte-code, e então interpretadas pelo Python. Para evitar 
que esta operação seja repetida a cada passo, o método compileEqs 
pré-compila estas expressões, o que acelera em muito a execução 
do programa 6.2. 

Ao final da listagem 6.2, vemos a especificação do modelo e, na 
figura 6.8, o seu resultado. 

O pacote integrate também nos oferece uma outra interface 
para a integração numérica chamada ode. A classe ode é uma al- 
ternativa orientada a objetos, à função odeint. A listagem 6.3, 
mostra como implementar o mesmo sistema de equações (6.2) uti- 
lizando a classe ode. 
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Figura 6.8: Gráfico com o resultado da integração do modelo 6.2. 
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Listagem 6.3: Integração numérica utilizando a classe ODE. 











# Disponivel no pacote de programas como: 
modelo ode minimo.py 

#—*—encoding : utf -8-+— 

from scipy import integrate 

from numpy import x 

import pylab as P 


def Equations(t,y): 
maca 
Define os sistema de EDOs calculando 
cada equacao 
com base no valor anterior e retornando 
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25 
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34 
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if 
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as derivadas. 
mma 


#——Cria vetor de equacoes 





eqs = ['3.0xy[0]-2.0xy[0]xy[1]','-2.0xy 
[1]+y[O]*y [1] "| 

Neq=len (eqs) 

ydot = zeros((Neq) ,’d’) 

for k in xrange(Neq): 
ydot[k] = eval(eqs[k]) 

return ydot 


name =" man ": 





r = integrate .ode(Equations). 
set integrator(’vode’) 

r.set initial value([1,1],0) 

tf = 10 #tempo final 

dt = 0.1 

i= || 

y=[ 

while r.successful() and r.t <= tf: 
r.integrate(r.t+dt) 
t.append(r.t) 
y.append(r.y) 

print r.y 

#Plota resultados 


P.plot (t,array(y)[:,0], ’v—’,t,array(y) 
[: ,1] , tg) 

P.title(’Integrador Vode’) 

P. legend ([’Presa’,’Predador ’]) 

P. savefig(’lv2.png’ ,dpi=400) 

P. show () 











Se vocé necessita construir, simular e analisar modelos de equa- 
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ções diferenciais com fregiiência, talvez prefira utilizar um software 
mais completo, desenvolvido por mim, chamado Model-Builder?. 


6.3 Grandezas, Dimensões e Unidades 


Ao se construir modelos matemáticos, cedo ou tarde nos deparamos 
com a necessidade de aproximar o modelo conceitual do sistema 
real para dar valor preditivo ao modelo. Este processo envolve o 
mapeamento da métrica do sistema real no modelo matemático, 
ou seja, fazer com que os parâmetros ou constantes do nosso mo- 
delo correspondam, numericamente, a mensurações efetuadas no 
sistema real. 

Este processo de parametrização envolve, frequentemente, a uti- 
lização de medidas das diferentes dimensões do sistema real (massa, 
comprimento, temperatura, etc). Estas mensurações raramente são 
efetuadas pelo modelador. Este, frequentemente, se utiliza de me- 
didas publicadas na literatura científica, expressas nas mais varia- 
das unidades de medida. A escolha das unidades de medida não 
altera as dimensões do objeto de estudo (medir a nossa mesa de 
trabalho em milímetros ao invés de metros não a torna mais longa), 
mas altera a ordem de grandeza do valor numérico que representa 
a dimensão medida. 

Os modelos matemáticos relacionam as várias dimensões do sis- 
tema estudado, por meio das grandezas numéricas que as represen- 
tam. Por isso, é fundamental que as variáveis e parâmetros do 
nosso modelo que representem uma mesma dimensão do objeto, 
sejam expressas nas mesmas unidades de medida. Por exemplo, 
se desenvolvemos um modelo que pretende correlacionar massa do 
coração com massa corporal, não podemos expressar a massa do 
coração em gramas(g) e a massa corporal em quilogramas(kg)*. 





ºhttp://model-builder. sourceforge .net 
4A menos que adicionemos contantes ao modelo que re-equilibrem a equa- 
ção do ponto de vista dimensional 
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Tabela 6.2: Dimensões básicas. 








Grandeza física Dimensão Unidade (SI) Símbolo 
Comprimento L metro m 
Massa M quilograma kg 
Tempo T segundo s 
Temperatura 0 kelvin K 
Quantidade 

de uma substância N mol mol 
Corrente elétrica I ampére A 
Intensidade luminosa J candela cd 





` 


Grandeza, dimensão e unidade não são sinônimos e devido à 
ubiquidade da sua utilização em modelagem, são conceitos que de- 
vem estar muito bem definidos na mente de todo modelador. 


Unidades derivadas de nomes próprios (e.g. Lord Kelvin, 
tabela 6.2),têm seu símbolo maiúsculo, mas o nome da unidade 
é grafado em minúsculas. 


As dimensões de variáveis e parâmetros utilizados em um mo- 
delo podem representar dimensões físicas diretamente mensuráveis 
do sistema, como massa, comprimento, etc. ou podem ser constru- 
tos do investigador, que visam representar propriedades do sistema 
que interessam ao modelo (preço, periculosidade, fecundidade etc.). 
Devido a isso, antes de começar um trabalho de modelagem, deve- 
mos definir quais são as nossas dimensões básicas. Estas dimensões 
são escolhidas de forma a que todas as outras dimensões utilizadas 
no modelo, possam ser expressas em termos destas dimensões bá- 
sicas, ou seja, através de operações algébricas entre as dimensões 
básicas. A tabela 6.2 lista algumas dimensões básicas que podem 
ser úteis no contexto da modelagem de sistemas biológicos. 

Várias dimensões derivadas podem ser construídas a partir do 
limitado conjunto de dimensões básicas apresentado na tabela 6.2. 
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Tabela 6.3: Dimensões derivadas. 
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Grandeza física Dimensão Unidade (SI) Símbolo 
(derivação) 
Área E metro? m? 
Volume L? metro? m3 
Velocidade pr metro/ segundo m/s 
Aceleração LT? metro/ segundo? m/s? 
Força MLT? newton N (kg m s~?) 
Energia MET? joule J (kg m? s7?) 
Potência MET? watt W (kg m? s~?) 
Pressão ML-T? pascal Pa (Nm?) 
Viscosidade ML-T! x 1071 poise P 
Voltagem METS]? volt V 
Resistência elét. MAPS ohm Q (V/A) 
Angulo — graus, radianos graus, radianos 
Veloc. angular ie radianos/seg. radianos/s 
Frequéncia i gs hertz Hz (s7!) 





A tabela 6.3 lista dimensões familiares ao leitor e suas derivações. 

É interessante notar que algumas grandezas físicas são adimen- 
sionais (e.g. ângulo, tabela 6.3). Este fato não as impede, entre- 
tanto, de possuir unidades. 


Um ângulo é calculado como a razão entre um dado arco e 
o raio da circunferência que o define. Portanto, sua dimensão é 
L/L=1. 


O fato de um ângulo ser adimensional, faz com que seu valor 
numérico não se altere, ao se utilizar diferentes unidades de medida 
para o raio e o arco da circunferência que o contém. Funções trigo- 
nométricas são adimensionais pois o argumento destas é um ângulo, 
que é adimensional. O expoente de uma função exponencial nada 
mais é do que um logaritmo, e se os logaritmos são adimensionais, 
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os expoentes também o serão. 


Outros adimensionais: 
Funções trigonométricas, 


Expoentes, 
Logaritmos, 
Contagens, 
T, e, etc. 


Por exemplo, em uma equação de crescimento exponencial y = 
e*t, onde t é o tempo, o parâmetro k deve ter dimensão T~! para 
que o expoente seja adimensional. 


Análise Dimensional 


Um modo eficiente de evitar erros dimensionais na construção das 
equações que compõem o nosso modelo, consiste em construir uma 
versão da equação em questão, substituindo-se as variáveis e parâ- 
metros por suas unidades ou dimensões. Em seguida, expande-se 
as expressões em ambos os lados da igualdade em termos das di- 
mensões básicas. Então simplificamos ao máximo os dois lados da 
equação e verificamos se são de fato iguais. A este processo dá-se 
o nome de análise dimensional. 

Todas as equações científicas devem estar dimensionalmente 
corretas, assim sendo, a análise dimensional é uma excelente fer- 
ramentar para analisar nossas formulações. Vamos listar algumas 
regras básicas da análise dimensional: 


1. Dimensões e unidades podem ser combinadas e manipuladas, 
utilizando-se regras algébricas. 


2. Os dois lados de uma equação devem ser dimensionalmente 
idênticos. 
3. Deve-se tomar cuidado para não cancelar unidades idênticas 


de objetos independentes. Por exemplo, ee não é uma 
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expressão adimensional, apesar de ser uma razão entre dois 
volumes. 


4. Grandezas de dimensões diferentes não podem ser somadas 
nem subtraídas. 


Unidades também podem ser utilizadas, diretamente, em aná- 
lise dimensional. Unidades derivadas podem ser construídas a par- 
tir de unidades básicas. Porém, frequentemente, as unidades deri- 
vadas recebem símbolos especiais para simplificar sua notação (e.g. 
N, W, J etc. na tabela 6.3). 


O Pacote Unum 


5 Quando escrevemos nossos modelos em Python, podemos fazer 
uso de unidades para nossas variáveis de forma a não cometer erros 
quanto às dimensões do nosso problema. Vamos explorar algumas 
possibilidades interativamente dentro do Ipython. 


1 In [1]:from unum. units import + 
2 In [2]:M 
3 Out[2]:1.0 [m] 


Uma vez importadas as unidades do módulo units, podemos 
representar números com unidades. No exemplo acima temos a 
representação de 1 metro. As classes que representam as unida- 
des são derivadas das classes que representam os números puros 
em Python; portanto, todas as operações aritméticas válidas para 
números, são possíveis para números com unidades. O Unum vem 
com muitas unidades pré definidas, mas estas podem ser redefini- 
das, durante a sessão, assim como novas unidades podem ser defi- 
nidas. Todas as unidades prédefinidas são definidas em maiúsculas 
para facilitar a sua diferenciação de nomes associados a variáveis. 





50 pacote Unum pode ser baxado de http://home.scarlet .be/be052320/ 
Unum. html. 
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Qualquer grandeza pode ser definida multiplicando-se um número 
por uma unidade. 


In [3]:a-3M 

In [4]:t-1+S 

In [5]:a/t 

Out [5]:3.0 [m/s] 

In [6]:1/(3*M/S) 

Out [6]:0.333333333333 [s/m] 
In [7]:25*Mx«2 
Out[7]:25.0 [m2] 

In [8]:(3*M) *(4*M) 

10 Out[8]:12.0 [m2] 

u In [9]:13*KG*M/S**«2 
122 Out[9]:13.0 [kg.m/s2] 


o mn De A Ww N Hm 


Grandeza adimensionais também podem ser representadas. 


1 In [10]:(2 * M/S) » (3 x S/M) 
2 Out[10]:6.0 [] 


Agora que já aprendemos a operar com unidades, vamos imple- 
mentar um simples modelo com unidades. 


1 In [11]:massa=1.5+KG 

2 In [12]: velocidade=2:M/S 

3 In [13]: energia_cinetica=(massa*velocidade 
442) /2 

4 In [14]: energia_cinetica 

5 Out[14]:3.0 [kg.m2/s2] 


Evitando Erros 


Utilizar unidades nao é apenas uma questao estética, também pode 
ajudar a evitar enganos: 
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1 In [15]:energia cinetica+3KG 

2 DimensionError: [kg.m2/s2] incompatible with 
[kg] 

3 In [16]:MxxkG 

4 DimensionError: unit [kg] unexpected 


No exemplo acima, somos lembrados de que nao podemos somar 
grandezas com unidades diferentes, nem elevar metros a quilogra- 
mas! Expoentes devem sempre ser adimensionais. 

Também podemos fazer conversões de unidades. Vamos con- 
verter nossa energia cinética em joules: 


1 In [17]:energia cinetica.as(J) 
2 Out[17]:3.0 [J] 


Integração com Funções Matemáticas 


Já vimos que logaritmos e ângulos são adimensionais; portanto fun- 
ções logarítmicas e trigonométricas não aceitam números com uni- 
dades. No caso dos ângulos podemos usar pseudo-unidades como 
RAD(radianos) e ARCDEG(graus). 


In [18]:from math import pi,logl0, sin,cos 
In [19]: 10g10 (M/ANGSTROM) 

Out [19]:10.0 

In [20]: cos (180*ARCDEG) 

Out [20]: —1.0 

In [24]: cos (pi*RAD) 

Out [24]: —1.0 

In [25]: f = 440*HZ 

In [26]: sin(f) 

10 DimensionError: unit [Hz] unexpected 
u In [27]:dt = 0.1 * S 

2 In [28]: sin(f*dt*2* pi) 

13 Out[28]: —3.9198245344040927e-14 


O o | Det A Ww N e 
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As unidade do Unum também funcionam bem com outras estru- 
turas de dados, como matrizes do Numpy, por exemplo. 


1 In [1]:from unum. units import + 
2 In [2]:from numpy import x 

3 In [3]:a= arange (10) M 

a In [4]:a 

5 Out[4]: 

6 


array ([0.0 [m], 1.0 [m], 2.0 [m], 3.0 [m], 
4.0 [m], 5.0 [m], 6.0 [m] 


7 7.0 [m], 8.0 [m], 9.0 [m]], dtype= 
object ) 

a In [5]:ax*2 

ə Out [5]: 


10 array ([0.0 [m2], 1.0 [m2], 4.0 [m2], 9.0 [m2 
|, 16.0 [m2], 25.0 [m2], 
1 36.0 [m2], 49.0 [m2], 64.0 [m2], 81.0 
[m2]], dtype=object) 


Por fim, o Unum também simplifica automáticamente expres- 
sões de unidades. No exemplo abaixo, o Unum sabe que uma pressão 
multiplicada por uma área é uma força. Portanto, converte a uni- 
dade para Newtons (N). 


1 In [6]:forca = PA + M**2 
2 In [7]:forca 
3 Out[7]:1.0 [N] 


Conforme já mencionamos, também podemos criar novas uni- 
dades. Vejamos abaixo como fazer isso: 


Listagem 6.4: Criando novas unidades. 


In [1]:from unum import Unum 
In [2]: unit = Unum. unit 

In [3]:LEGUA = unit(’legua’) 
In [4]:LEGUA 


e WÙ N e 
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s Out [4]:1.0 [legua] 

6 In [5]:KLEGUA = unit ("kilolegua ',1000+LEGUA) 
7 In [6]:20+KLEGUA+1+LEGUA 

a Out[6]:20.001 [kilolegua] 


Uma Aplicação Concreta 


Muitas vezes, ao modelar um sistema biológico, a relação entre 
grandezas biológicas e físicas não é óbvia. Nestes casos, a análise 
dimensional pode ajudar a validar nossas formulações. Suponha 
que um pesquisador deseje determinar o trabalho realizado pelo 
coração. Ele se lembra da física que: 


Trabalho(J) = Forca(N) x distancia(m) 


Esta equação não é diretamente aplicável ao coração, pois este não 
se desloca e a força que exerce não é facilmente mensurável. Con- 
tudo, a força exercida pelo coração se reflete na pressão sanguínea, 
e o volume de sangue bombeado parece ser análogo à distância 
da fórmula original. Então nosso pesquisador-modelador escreve, 
timidamente, a seguinte fórmula: 


Trabalho = Pressão x Volume 


Mas como saber se esta relação é correta? Fazendo a análise di- 
mensional. 


N 
Trabalho(J) = Pressão x Volume = — x m=Nm=J 
m 
Esta definição de Trabalho (N m), não é a mesma da tabela 6.3 


mas um pouco de álgebra pode demonstrar a sua validade. Com 
o Unum, isso seria uma tarefa trivial: 





Lembre-se de que Trabalho=Energia. 
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1 In [8]:J — PA * M**3 
2 Out [8]: True 


Para que uma análise dimensional funcione com unidades, de- 
vemos nos manter em um mesmo sistema de unidades. O sistema 
utilizado em ciência é o chamado Sistema Internacional (SI). As 
unidades apresentadas nas tabelas 6.2 e 6.3 estão de acordo com o 
SI. 

Um detalhe em relação a unidades que é frequentemente mal 
entendido, é a aplicação de fatores de escala normalmente expressos 
como prefixos às unidades (ver tabela 6.4). Devido a este fato o 
SI é frequentemente denominado sistema MKS (metro, kilograma, 
segundo). Um outro sistema que frequentemente é confundido com 
oSlé o CGS (centímetro, grama, segundo). Apesar deste último se 
diferenciar do SI apenas nos prefixos, é um sistema completamente 
diferente. 


MKS vs. CGS 


Força(MKS): 
Newton (m - kg/s?) 
Força(CGS): 

Dyne (cm - g/s?) 


Ao adicionar ou modificar prefixos de unidades estamos aban- 
donando nosso sistema de unidades original e nossas equações não 
estarão mais equilibradas dimensionalmente, a menos que realize- 
mos as correções necessárias nos demais termos da equação. 

Para re-equilibrar dimensionalmente equações cujas unidades 
de uma ou mais de suas variáveis tenham sido modificadas, preci- 
samos incluir fatores de correção. 

Consideremos a relação entre a massa corporal e a massa do 
Coração: 

Y = 0.006M 
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Tabela 6.4: Prefixos de Unidades 








Prefixo Símbolo Fator | Prefixo Símbolo Fator 
yocto y 10774 | deca da 10 
zepto Z 10721 | hecto h 10? 
atto a 10-18 | kilo k 10° 
femto f 10-15 | mega M 108 
pico p 10-12 | giga G 10° 
nano n 107° | tera T 1012 
micro u 1076 | peta P 1015 
mili m 1078 | exa E 1018 
centi c 107? | zetta Z 1021 
deci d 107} | yotta Y 10?4 








colocando esta equação em termos dimensionais: 
M=1-M 


se quisermos expressar a massa do coração em gramas (CGS), man- 
tendo a massa corporal em kg (SI/MKS), basta apenas multiplicar- 
mos o lado direito da equação por 1000 para reequilibrar a equação. 
Assim, teríamos: 

Y=6M 


Contudo, nem sempre a determinação dos fatores de correção é 
tão óbvia. Vejamos a seguinte equação, que relaciona a massa do 
fígado com a massa corporal (ambas em kg): 


Mg = 0.082. M28" (6.2) 


Esta relação se mantém, para mamíferos, ao longo de várias ordens 
de magnitude de tamanho. Se estivéssemos interessados apenas em 
pequenos roedores, seria mais conveniente trabalhar com gramas ao 
invés de kilogramas. O investigador desavisado, determina a massa 
de um hamster (200g), o aplica na equação 6.2: e obtém o seguinte 
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resultado: 
My = 8.24 


Este valor não seria correto nem em gramas e muito menos em 
kg! O que poderia estar errado? Por desencargo de consciência, 
ele decide realizar o cálculo novamente aplicando a massa em kg 
(0.2kg): 

My = 0.020kg 


este resultado (20g) parece mais realistico. Analisando dimensio- 
nalmente a equação, podemos entender o que deu errado em nossa 
conversão de unidades: 


Mp = 0.082-(1000- M.)º8” 


Se esta equação possui apenas duas variáveis, ambas de massa, 
porque a simples substituição de unidades não funciona? A res- 
posta está no fato de que a massa corporal está elevada a 0.87, 
portanto sua unidade não é mais Kg, da mesma forma que 1 metro 
quadrado não é igual a 1 metro. Para a equação ser válida dimen- 
sionalmente, a constante 0.082 não pode ser adimensional. Para 
descobrir a sua unidade basta rearranjarmos a equação, 


My 


e resolvê-la com o Unum. Como vemos a unidade de nossa constante 
é kg®!8, 


1 In [13]:KG/KG+*0.87 
» Out[13]:1.0 [kg0.13] 


se quisermos multiplicar a unidade da massa do coração por 1000 
(Kg — g), temos que multiplicar a unidade da constante por 1000 
também e isso representa multiplicá-la por 1000º-!3. Podemos ve- 
rificar que esta operação retorna um número 1000 vezes o valor em 
Kg, ou seja, o valor em gramas. 
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In [20]:1000**0.13*KG**0.13 *1000**0.87*KG 


**0.87 


Out[20]:1000.0 [kg] 
In [21]:0.082*«(1000**0.13) *(200xx0.87) 
Out [21]:20.216685199791563 


6.4 Exercícios 


1. 


Determine as dimensões das seguintes grandezas (manual- 
mente e depois utilizando o Unum): 


a) Volume 
b 


c 


) 
) Aceleração (velocidade /tempo) 
) Densidade (massa/volume) 
d) Força (massa x aceleração) 


e) Carga elétrica (corrente x tempo) 


. Utilizando as repostas da questão anterior determine as di- 


mensões das seguintes grandezas: 


a) Pressão (força/área) 


b) (volume)? 


) 
) 
c) Campo elétrico (força/carga elétrica) 
d) Trabalho (força x distância) 

) 


e) Energia Potencial Gravitacional (= mgh =massax ace- 
leração gravitacional x altura) 


Capitulo 7 


Teoria de Grafos 


Breve introdução a teoria de grafos e sua representação 
computacional. Introdução ao Pacote NetworkX, vol- 
tado para a manipulação de grafos. Pré-requisitos: 
Programação orientada a objetos. 


7.1 Introdução 


A teoria de grafos é uma disciplina da matemática cujo objeto de 
estudo se presta, muito bem, a uma representação computacional 
como um objeto. Matematicamente, um grafo é definido por um 
conjunto finito de vértices (V) e por um segundo conjunto (A) de 
relações entre estes vértices, denominadas arestas. Grafos tem apli- 
cações muito variadas, por exemplo: uma árvore genealógica é um 
grafo onde as pessoas são os vértices e suas relações de parentesco 
são as arestas do grafo. 

Um grafo pode ser definido de forma não ambígua, por sua lista 
de arestas (4), que implica no conjunto de vértices que compõem 
o grafo. Grafos podem ser descritos ou mensurados através de um 
conjunto de propriedades: 


e Grafos podem ser direcionados ou não; 
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A ordem de um grafo corresponde ao seu número de vértices; 


O tamanho de um grafo corresponde ao seu número de ares- 
tas; 


Vértices, conectados por uma aresta, são ditos vizinhos ou 
adjacentes; 


A ordem de um vértice corresponde ao seu número de vizi- 
nhos; 


U 
ces; 
U 


vértice; 





U 


m caminho é uma lista de arestas que conectam dois vérti- 


m ciclo é um caminho que começa e termina no mesmo 


m grafo sem ciclos é denominado aciclico. 


A lista acima não exaure as propriedades dos grafos, mas é 
suficiente para esta introdução. 

Podemos representar um grafo como um objeto Python de vá- 
rias maneiras, dependendo de como desejamos utilizá-lo. A forma 
mais trivial de representação de um grafo em Python seria feita 
utilizando-se um dicionário. A Listagem 7.1 mostra um dicionário 
representando o grafo da figura 7.1. Neste dicionário, utilizamos 
como chaves os vértices do grafo associados a suas respectivas listas 
de vizinhos. Como tudo em Python é um objeto, poderíamos já 
nos aproveitar dos métodos de dicionário para analisar nosso grafo 
(Listagem 7.2). 


Listagem 7.1: Definindo um grafo como um dicionário. 
Lessee Sf tare de] bd ea O 


[’a’,’d?],’d’?:[’b’,’c’,’a’],’e’:[’a’,’b 


1) 
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Figura 7.1: Um grafo simples. 


Podemos utilizar o método keys para obter uma lista dos vér- 
tices de nosso grafo. 


Listagem 7.2: Obtendo a lista de vértices. 


1 >>> g . keys() 
2 Pa’, AG? 4 *b’, 'e”, 'dº] 

Uma extensão do conceito de grafos é o conceito de redes. Redes 
são grafos nos quais valores numéricos são associados às suas ares- 
tas. Redes herdam as propriedade dos grafos e possuem algumas 
propriedades específicas. 

A representação de redes, a partir de objetos pitônicos simples, 
como um dicionário, também é possivel. Porém, para dar mais 
alcance aos nossos exemplos sobre teoria de grafos, vamos nos uti- 
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lizar do pacote NetworkX! que já implementa uma representação 
bastante completa de grafos e redes em Python. 


7.2 NetworkX 


O pacote NetworkX se presta à criação, manipulação e estudo da 
estrutura, dinâmica e funções de redes complexas. 

A criação de um objeto grafo a partir de seu conjunto de ares- 
tas, 4, é muito simples. Seja um grafo G com vértices V = 
{W, X,Y, Z}: 


G:A= TUM, Z), (Z, Y), (Y, X), (X, Z)t 


Listagem 7.3: Definindo um grafo através de seus vértices 





# Disponivel no pacote de programas como: 


graphl.py 
import networkx as NX 


im 


G = NX. Graph () 

G.add_edges_from([( W; Z), CZ, Y), Y,’ 
RODO 0) 

sprint G.nodes(), G.edges() 


ao os WwW N 

















Executando o código acima, obtemos: 
yY” rx! rg way ' X’) (Y ' Z") (X' 'Z') ((Z' 'W5] 


Ao lidar com grafos, é conveniente representá-los graficamente. 
Vejamos como obter o diagrama do grafo da listagem 7.3: 


Listagem 7.4: Diagrama de um grafo 








Inttps://networkx.lanl.gov/ 


7.2. NETWORKX 173 


= 


# Disponivel no pacote de programas como: 


graph2.py 
import networkx as NX 


G = NX. Graph () 
G.add_edges_from (|(W; Z’), CZ, Y), Y,’ 
X’) ,(’X’,7Z’)]) 


o os wa 


import pylab as P 
NX. draw (G) 
P. show () 


O o N Q 

















A funcionalidade do pacote NetworkX é bastante ampla. 
seguir exploraremos um pouco desta funcionalidade. 


Construindo Grafos 


A 


O NetworkX oferece diferentes classes de grafos, dependendo do tipo 
de aplicação que desejada. Abaixo, temos uma lista dos comandos 


para criar cada tipo de grafo. 
G=Graph() Cria um grafo simples e vazio G. 
G=DiGraph() Cria grafo direcionado e vazio G. 


G=XGraph() Cria uma rede vazia, ou seja, com arestas que po- 


dem receber dados. 
G=XDiGraph() Cria uma rede direcionada. 


G-empty graph(n) Cria um grafo vazio com n vértices. 


G-empty graph(n,create using-DiGraph()) Cria um grafo 


direcionado vazio com n vértices. 


G=create empty copy(H) Cria um novo grafo vazio do mesmo 


tipo que H. 
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Figura 7.2: Diagrama de um grafo 


Manipulando Grafos 


Uma vez de posse de um objeto grafo instanciado a partir de uma 
das classes listadas anteriormente, é de interesse poder manipulá-lo 
de várias formas. O próprio objeto dispõe de métodos para este 
fim: 


G.add node(n) Adiciona um único vértice a G. 
G.add nodes from(lista) Adiciona uma lista de vértices a G. 
G.delete node(n) Remove o vértice n de G. 


G.delete nodes from(lista) Remove uma lista de vértices de 


G. 
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G.add edge(u,v) Adiciona a aresta (u,v) a G. Se G for um 
grafo direcionado, adiciona uma aresta direcionada u — v. 
Equivalente a G.add edge((u,v)). 


G.add edges from(lista) Adiciona uma lista de arestas a G. 
G.delete edge(u,v) Remove a aresta (u,v). 


G.delete edges from(lista) Remove uma lista de arestas de 


G. 


G.add path(listadevertices) Adiciona vértices e arestas de forma 
a compor um caminho ordenado. 


G.add cycle(listadevertices) O mesmo que add path, exceto 
que o primeiro e o último vértice são conectados, formando 
um ciclo. 


G.clear() Remove todos os vértices e arestas de G. 
G.copy() Retorna uma cópia “rasa” do grafo G.? 
G.subgraph(listadevertices) Retorna subgrafo correspondente 


à lista de vértices. 


Criando Grafos a Partir de Outros Grafos 


subgraph(G, listadevertices) Retorna subgrafo de G correspon- 
dente à lista de vértices. 


union(G1,G2) União de grafos. 


disjoint union(G1,G2) União disjunta, ou seja, assumindo que 
todos os vértices são diferentes. 





2Uma cópia rasa significa que se cria um novo objeto grafo referenciando 
o mesmo conteúdo. Ou seja, se algum vértice ou aresta for alterado no grafo 
original, a mudança se reflete no novo grafo. 
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cartesian product(G1,G2) Produto cartesiano de dois grafos 
(Figura 7.3). 


compose(G1,G2) Combina grafos, identificando vértices com mesmo 
nome. 


complement (G) Retorna o complemento do grafo(Figura 7.3). 
create empty copy(G) Cópia vazia de G. 


convert to undirected(G) Retorna uma cópia não direcionada 


de G. 


convert to directed(G) Retorna uma cópia não direcionada 
de G. 


convert node labels to integers(G) Retorna uma cópia com 
os vértices renomeados como números inteiros. 





Gerando um Grafo Dinamicamente 


Muitas vezes, a topologia da associação entre componentes de um 
sistema complexo não está dada a priori. Frequentemente, esta 
estrutura é dada pela própria dinâmica do sistema. 

No exemplo que se segue, simulamos um processo de contágio 
entre os elementos de um conjunto de vértices, observando ao final, 
a estrutura produzida pelo contágio. 


Listagem 7.5: Construindo um grafo dinamicamente 





pá 


# Disponivel no pacote de programas como: 
grafodin.py 

import networkx as NX 

import threading ,random, pylab as P 








ao èe WB N 


class Contagio: 


7.2. 
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Grafo G Produto cartesiano GxGeomplemento de GxG 

















Figura 7.3: Grafo, produto cartesiano e complemento. 


def __init_ (self ,nome): 
self .nome = nome 
self.doente = 0 
self .transmite () 
def transmite(self): 
if G. doentes == G. order (): 
return 
for alvo in random.sample(G. nodes () 
3): 
if not alvo. doente: 
G.add edge((self ,alvo)) 
print "%s infectou %s"%(self 
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nome, alvo.nome) 


17 t = threading. Thread(target= 
alvo. contraiu ()) 

18 t.start () 

19 def contraiu(self): 

20 self. doente +-1 

21 G. doentes +=1 

22 self.transmite () 


24||G = NX. XDiGraph () 

25||G. doentes = 0 

æ|| nos = [Contagio(n) for n in xrange(80) | 
a7||G. add nodes from (nos) 

2s|| caso indice = G.nodes() [0] 

20|| caso indice.contraiu () 

so|| print "usamos %s das arestas possiveis"%(NX. 


density (G)) 
ai print NX. degree histogram (G), G. doentes 
32|| nomes = dict ([(no,no.nome) for no in G. nodes 


33||NX. draw (G, labels=nomes, alpha=0.7,width=2, 
style=’dotted’, node_size=450, font_ size 
=14) 

s4||/P. savefig (’contagio. png’ ,dpi=400) 

35||P. show () 

















Módulo threading: Permite executar mais de uma parte do 
programa em paralelo, em um “fio” de execução independente. 
Este fios, compartilham todas as variáveis globais e qualquer 
alteração nestas é imediatamente visível a todos os outros fios. 


O objeto grafo do NetworkX aceita qualquer objeto como um 
vértice. Na listagem 7.5, nos valemos deste fato para colocar ins- 
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tâncias da classe Contagio como vértices do grafo G. O grafo G é 
contruído somente por vértices (desconectado). Então infectamos 
um vértice do grafo, chamando o seu método contraiu(). O vér- 
tice, após declarar-se doente e incrementar o contador de doentes 
a nível do grafo, chama o método transmite(). 

O método transmite assume que durante seu período infec- 
cioso, cada vértice tem contatos efetivos com apenas dez outros 
vértices. Então cada vértice irá transmitir para cada um destes, 
desde que não estejam já doentes. 

Cada vértice infectado inicia o método contraiu em um “th- 
read” separado. Isto significa que cada vértice sai infectando os 
restantes, em paralelo. Na verdade, como o interpretador Python 
só executa uma instrução por vez, cada um destes objetos recebe 
do interpretador uma fatia de tempo por vez, para executar suas 
tarefas. Pode ser que o tempo de uma destas fatias seja suficiente 
para infectar a todos no seu grupo, ou não. Depois que o processo 
se desenrola, temos a estrutura do grafo como resultado (Figura 
7.4) 


Construindo um Grafo a Partir de Dados 


O conceito de grafos e redes é extremamente útil na representação 
e análise de sistemas complexos, com muitos componentes que se 
relacionam entre si. Um bom exemplo é uma rede social, ou seja, 
uma estrutura de interação entre pessoas. Esta interação pode 
ser medida de diversas formas. No exemplo que se segue, vamos 
tentar inferir a rede social de um indivíduo, por meio de sua caixa 
de mensagens. 


Listagem 7.6: Construindo uma rede social a partir de e-mails 





ıl Æ Disponivel no pacote de programas como: 
mnet . py 

2| import email, sys 

3| import email. Errors 


180 








CAPITULO 7. TEORIA DE GRAFOS 

















Figura 7.4: Resultado da simulação do exemplo 7.5. 


import mailbox 
import networkx as NX 
from pylab import show 


def msgfactory(fp): 
try: 
return email. message from file(fp) 
except email. Errors. MessageParseError: 
return * 


def starG (mess ,G) : 
try: 
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16 centro = mess.get(’from’).split () 
[—1].strip(’<>’) 

17 pontas = [j.split()[-1].strip('<>") 
for j in mess.get_all(’to’) [0]. 
split(’,’)] 

18 arestas = [(centro,k) for k in 
pontas | 

19 G.add edges from(arestas) 

20 return G 

21 except: 

22 print ’falhou’ 


24|| dir=’ /home/flavio /Mail/inbox” 

254 Veja documentacao do modulo mailbox 

2| # para outros tipo de mailboxes. 

27|| mbox = mailbox. Maildir (dir, msgfactory) # 
mailbox do kmail 

28||G = NX. DiGraph () 

2| for n in xrange (50): 

30 i = mbox. next () 

31 starG (i ,G) 

32| print G.nodes() 

33|/|G = NX. convert node labels to integers(G) 
34||NX.draw(G, width=2, style=’dotted’, alpha 
=0.5) 

35|| show () 

















Na Listagem 7.6, usamos dois módulos interessantes da bibli- 
oteca padrão do Python: O módulo email e o módulo mailbox. 
mailbox. 


Módulo email: Módulo para decodificar, manusear, e com- 
por emails. 


182 CAPITULO 7. TEORIA DE GRAFOS 


Módulo mailbox: Conjuto de classes para lidar com caixas 
de correio no formato Unix, MMDF e MH. 


Neste exemplo, utilizei a minha mailbox associada com o pro- 
grama Kmail; portanto, se você usa este mesmo programa, basta 
substituir o diretório de sua mailbox e o programa irá funcionar 
para você. Caso use outro tipo de programa de email, consulte a 
documentaçao do Python para buscar a forma correta de ler o seu 
mailbox. 

A classe Maildir retorna um iterador, que por sua vez, retor- 
nará mensagens decodificadas pela função msgfactory, definida por 
nós. Esta função se utiliza do módulo email para decodificar a 
mensagem. 

Cada mensagem recebida é processada para gerar um grafo do 
tipo “estrela”, com o remetente no centro e todos os destinatários 
da mensagem nas pontas. Este grafo é então adicionado ao grafo 
original, na forma de uma lista de arestas. Depois de todas as 
mensagens terem sido assim processadas, geramos a visualização 
do grafo (Figura 7.5). 


7.3 Exercícios 


1. Determine o conjunto de arestas A que maximiza o tamanho 
do grafo cujos vértices são dados por V = {a,b,c,d, e}. 


2. No exemplo do contágio, verifique se existe alguma relação 
entre o tamanho da amostra de cada vértice e a densidade 
final do grafo. 


3. Ainda no exemplo do contágio, refaça o experimento com um 
grafo de topologia dada a priori no qual os vértices só podem 
infectar seus vizinhos. 
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Figura 7.5: Rede social a partir de mensagens de email. 


de saída do iterador mbox. 


. Insira um print no laço for do exemplo 7.6 para ver o formato 


. Modifique o programa 7.6 para associar apenas mensagens 


que contêm uma palavra em comum. 


Capitulo 8 


Interação com Bancos de 
Dados 


Apresentação dos módulos de armazenamento de dados 
Pickle e Sqlite3 que fazem parte da distribuição padrão 
do Python. Apresentação do pacote SQLObject para 
comunicação com os principais sistemas de bancos de 
dados existentes. Pré-requisitos: Conhecimentos bá- 
sicos de bancos de dados e SQL. 


Gerenciamento de dados não se constitui numa disciplina cien- 
tífica per se. Entretanto, cada vez mais, permeia as atividades 
básicas de trabalho científico. O volume crescente de dados e o au- 
mento de sua complexidade há muito ultrapassou a capacidade de 
gerenciamento através de simples planilhas. 

Atualmente, é muito comum a necessidade de se armazenar da- 
dos quantitativos, qualitativos e mídias dos mais diferentes forma- 
tos(imagens, vídeos, sons) em uma plataforma integrada de onde 
possam ser facilmente acessados para fins de análise, visualização 
ou simplesmente consulta. 

A linguagem Python dispõe de soluções simples para resolver 
esta necessidade em seus mais distintos níveis de sofisticação. Se- 
guindo a filosofia de “baterias incluídas” do Python, a sua biblioteca 
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padrão nos apresenta o módulo Pickle e cPickle e, a partir da versão 
2.5, o banco de dados relacional sqlite3. 


8.1 O Módulo Pickle 


O módulo pickle e seu primo mais veloz cPickle, implementam 
algoritmos que permitem armazenar, em um arquivo, objetos im- 
plementados em Python. 


Listagem 8.1: Exemplo de uso do módulo pickle 
In [1]:import pickle 


In [2]: class oi: 
adia def digaoi(self): 


1 

2. 

3 

4 Ds print "oi" 

s In [3]:a= oi() 

6 In [4]:f = open(’picteste’,’w’) 
7 In [5]: pickle .dump(a, f) 

s In [6]:f.close() 

ə In [7]: f = open(’picteste’,’r’) 
10 In [8]:b=pickle.load(f) 

u In [9]:b. digaoi() 

12 Ol 


Como vemos na listagem 8.1, com o módulo pickle podemos arma- 
zenar objetos em um arquivo, e recuperá-lo sem problemas para uso 
posterior. Contudo, uma característica importante deste módulo 
não fica evidente no exemplo 8.1. Quando um objeto é armaze- 
nado por meio do módulo pickle, nem o código da classe, nem 
seus dados, são incluidos, apenas os dados da instância. 


1 In [10]:class oi: 

2 .10.: def digaoi(self ,nome=’flavio’): 
3 .10.: print ’oi %s! ’%nome 
4 
5 


In [11]: f = open(’picteste’,’r’) 
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6 In [12]: b=pickle.load(f) 
7 In [13]:b. digaoi () 
s oi flavio! 


Desta forma, podemos modificar a classe, e a instância arma- 
zenada reconhecerá o novo código ao ser restaurada a partir do 
arquivo, como podemos ver acima. Esta característica significa 
que os pickles não se tornam obsoletos quando o código em que 
foram baseados é atualizado (naturalmente isto vale apenas para 
modificações que não removam atributos já incluídos nos pickles). 

O módulo pickle não foi construído para armazenamento de 
dados, pura e simplesmente, mas de objetos computacionais com- 
plexos, que podem conter em si, dados. Apesar desta versatilidade, 
peca por consistir em uma estrutura de armazenamento legível ape- 
nas pelo próprio módulo pickle em um programa Python. 


8.2 O módulo Sqlite3 


Este módulo passa a integrar a biblioteca padrão do Python a partir 
da versão 2.5. Portanto, passa a ser uma excelente alternativa 
para usuários que requerem a funcionalidade de um banco de dados 
relacional compatível com SQL!. 

O Sqlite nasceu de uma biblioteca em C que disponibilizava 
um banco de dados extremamente leve e que dispensa o conceito 
“servidor-cliente”. No sqlite, o banco de dados é um arquivo ma- 
nipulado através da biblioteca sqlite. 

Para utilizar o sqlite em um programa Python, precisamos im- 
portar o módulo sqlite3. 


1 In [1]: import sqlite3 





'SQL significa “Structured Query Language”. o SQL é um padrão internaci- 
onal na interação com bancos de dados relacionais. Para saber mais, consulte 
http://pt.wikipedia.org/wiki/SQL 
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O próximo passo é a criação de um objeto “conexão”, através 
do qual podemos executar comandos SQL. 


1 In [2]:c = sqlite3.connect (’/tmp/exemplo’) 


Agora dispomos de um banco de dados vazio, consistindo no 
arquivo exemplo, localizado no diretório /tmp. O sqlite também 
permite a criação de bancos de dados em RAM; para isso basta 
substituir o nome do arquivo pela string “:memory:”. Para po- 
dermos inserir dados neste banco, precisamos primeiro criar uma 
tabela. 


x 35:3 


1 In [3]:c.execute( create table especimes ( 
nome text, altura real, peso real)’’’) 
2 Out[3]:<sqlite3.Cursor object at 0x83fed10> 


Note que os comandos SQL são enviados como strings através do 
objeto Connection, método execute. O comando create table 
cria uma tabela; ele deve ser necessáriamente seguido do nome da 
tabela e de uma lista de variáveis tipadas(entre parênteses), cor- 
respondendo às variáveis contidas nesta tabela. Este comando cria 
apenas a estrutura da tabela. Cada variável especificada corres- 
ponderá a uma coluna da tabela. Cada registro, inserido subse- 
quentemente, formará uma linha da tabela. 


FF A 


1 In [4]:c.execute( insert into especimes 
values( "tom" ,12.5,2.3) 7"? 


O comando insert é mais um comando SQL útil para inserir 
registros em uma tabela. 

Apesar dos comandos SQL serem enviados como strings através 
da conexão, não se recomenda, por questão de segurança, utilizar 
os métodos de formatação de strings (’ ... values(%s,%s)’%(1,2)) 
do Python. Ao invés, deve-se fazer o seguinte: 


1 In [5]:t = (’tom’,) 
2 In [6]:c.execute(’select * from especimes 
where nome=?’ ,t ) 
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3 In [7]:c.fetchall () 
4 [( tom’, 12.5, 2.2999999999999998) | 


No exemplo acima utilizamos o método fetchall para recupe- 
rar o resultado da operação. Caso desejássemos obter um único 
registro, usaríamos fetchone. 


Abaixo, vemos como inserir mais de um registro a partir de 
estruturas de dados existentes. Neste caso, trata-se de repetir a 
operação descrita no exemplo anterior, com uma sequência de tu- 
plas representando a sequência de registros que se deseja inserir. 


1 In [8]:t = ((’jerry’ ,5.1,0.2) ,(’ butch’ 


,42.4,10.3)) 
2 In [9]:for i in t: 
3 .9.:  c.execute(’insert into especimes 


values(?,?,?)’,i) 


O objeto cursor também pode ser utilizado como um iterador 
para obter o resultado de uma consulta. 


1 In [10]:c.execute(’select * from especimes 
by peso’) 
In [11]: for reg in c: 
print reg 
("jerry ",5.1,0.2) 
('tom”, 12.5, 2.2999999999999998) 
( butch’ ,42.4,10.3) 


a ona e WwW N 


O módulo sqlite é realmente versátil e útil, porém, requer que 
o usuário conheça, pelo menos, os rudimentos da linguagem SQL. 
A solução apresentada a seguir procura resolver este problema de 
uma forma mais “pitônica”. 
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8.3 O Pacote SQLObject 


O pacote SQLObject? estende as soluções apresentadas até agora 
de duas maneiras: oferece uma interface orientada a objetos para 
bancos de dados relacionais e, também, nos permite interagir com 
diversos bancos de dados sem ter que alterar nosso código. 

Para exemplificar o sqlobject, continuaremos utilizando o sqlite 
devido à sua praticidade. 


Construindo um aranha digital 


Neste exemplo, teremos a oportunidade de construir uma aranha 
digital que recolherá informações da web (Wikipedia?) e as arma- 
zenará em um banco sqlite via sqlobject. 

Para este exemplo, precisaremos de algumas ferramentas que 
vão além do banco de dados. Vamos explorar a capacidade da 
biblioteca padrão do Python para interagir com a internet, e va- 
mos nos utilizar de um pacote externo para decodificar as páginas 
obtidas. 


Listagem 8.2: Módulos necessários 





pá 


# disponivel no pacote de programas como: 
aranha .py 

2|| import networkx as NX 

3|| from BeautifulSoup import SoupStrainer , 

BeautifulSoup as BS 

4| from BeautifulSoup import BeautifulStoneSoup 

as XS 

s| import sys, os, urllib2, urllib, re 

elfrom sqlobject import x 




















2nttp://uww.sqlobject.org/ 
Shttp://pt .wikipedia.org 
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O pacote BeautifulSoup* é um “destrinchador” de páginas da 
web. Um dos problemas mais comuns ao se lidar com páginas html, 
é que muitas delas possuem pequenos defeitos em sua construção 
que nossos navegadores ignoram, mas que podem atrapalhar uma 
análise mais minuciosa. Daí o valor do BeautifulSoup; ele é ca- 
paz de lidar com páginas defeituosas, retornando uma estrutura de 
dados com métodos que permitem uma rápida e simples extração 
da informação que se deseja. Além disso, se a página foi criada 
com outra codificação, o BeautifulSoup, retorna todo o conteúdo 
em Unicode, automaticamente, sem necessidade de intervenção do 
usuário. 

Da biblioteca padrão, vamos nos servir dos módulos sys, os, 
urllib, urllib2 e re. A utilidade de cada um ficará clara à 
medida que avançarmos no exemplo. 

O primeiro passo é especificar o banco de dados. O salobject 
nos permite escolher entre MySQL, PostgreSQL, sqlite, Firebird, 
MAXDB, Sybase, MSSQL, ou ADODBAPI. Entretanto, conforme já ex- 
plicamos, nos restringiremos ao uso do banco sqlite. 


Listagem 8.3: Especificando o banco de dados. 





laracnadir = os.path.expanduser(’~ /.laracna’ 
) 

9/ if not os.path. exists (laracnadir): 

10 os.mkdir(laracnadir ) 

sqlhub. processConnection = connectionForURI ( 
*sqlite:// ’+laracnadir+’/knowdb’) 


o 


1 


=. 

















Na listagem 8.3, criamos o diretório(os .mkdir) onde o banco 
de dados residirá (se necessário) e definimos a conexão com o 
banco. Utilizamos os.path.exists para verificar se o diretório 
existe. Como desejamos que o diretório fique na pasta do usuário, 
e não temos como saber, de antemão, qual é este diretório, utiliza- 





fhttp://www. crummy .com/software/BeautifulSoup/ 
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mos os. path. expanduser para substituir o ~ por /home/usuario 
como aconteceria no console unix normalmente. 

Na linha 11 da listagem 8.3, vemos o comando que cria a cone- 
xão a ser utilizada por todos os objetos criados neste módulo. 

Em seguida, passamos a especificar a tabela do nosso banco 
de dados como se fora uma classe, na qual seus atributos são as 
colunas da tabela. 


Listagem 8.4: Especificando a tabela ideia do banco de dados. 





16|| class Ideia (SQLObject): 
17 nome — UnicodeCol() 
18 nlinks = IntCol() 

19 links = PickleCol() 
20 ender = StringCol() 














A classe que representa nossa tabela é herdeira da classe SQLObject. 
Nesta classe, a cada atributo (coluna da tabela) deve ser atribuido 
um objeto que define o tipo de dados a ser armazenado. Neste 
exemplo, vemos quatro tipos distintos, mas existem vários outros. 
UnicodeCol representa textos codificados como Unicode, ou seja, 
podendo conter caracteres de qualquer língua. IntCol corresponde 
a números inteiros. PickleCol é um tipo muito interessante pois 
permite armazenar qualquer tipo de objeto Python. O mais in- 
teressante deste tipo de coluna, é que não requer que o usuário 
invoque o módulo pickle para armazernar ou ler este tipo de variá- 
vel, As variáveis são convertidas /reconvertidas automaticamente, 
de acordo com a operação. Por fim, temos StringCol que é uma 
versão mais simples de UnicodeCol, aceitando apenas strings de 
caracteres ascii. Em SQL é comum termos que especificar dife- 
rentes tipos, de acordo com o comprimento do texto que se deseja 
armazenar em uma variável. No sqlobject, não há limite para 
o tamanho do texto que se pode armazenar tanto em StringCol 
quanto em UnicodeCol 
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A funcionalidade da nossa aranha foi dividida em duas classes: 
Crawler, que é o rastejador propriamente dito, e a classe UrlFac 
que constrói as urls a partir da palavra que se deseja buscar na 
Wikipedia. 

Cada página é puxada pelo módulo ur11ib2. A função urlencode 
do módulo urllib, facilita a adição de dados ao nosso pedido, de 
forma a não deixar transparecer que este provém de uma aranha 
digital. Sem este disfarce, a Wikipedia recusa a conexão. 

A páginas são então analisadas pelo método verResp, no qual 
o BeautifulSoup tem a chance de fazer o seu trabalho. Usando 
a função SoupStrainer, podemos filtrar o resto do documento, 
que não nos interessa, analizando apenas os links (tags ’a’) cujo 
destino são urls começadas pela string /wiki/. Todos os artigos 
da wikipedia, começam desta forma. Assim, evitamos perseguir 
links externos. A partir da “sopa” produzida, extraímos apenas as 
urls, ou seja, o que vem depois de href=. Podemos ver na listagem 
8.5 que fazemos toda esta filtragem sofisticada em duas linhas de 
código(55 e 56), graças ao BeautifulSoup. 


Listagem 8.5: Restante do código da aranha. 





15| urlatual = * 

16 Class Ideia (SQLObject): 

17 nome — UnicodeCol() 

18 nlinks = IntCol() 

19 links = PickleCol() 

20 ender = StringCol() 

21 

22| class Crawler: 

23 def _ init (self,starturl depth): 
24 try: 

25 Ideia. createTable() 
26 except: 

27 pass 











28 self .SU = starturl 
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29 self. depth = depth 

30 self. fila =|] 

31 self. depth = depth 

32 self.curdepth = 0 

33 self.started = 0 

34 self.nlinks = 0 

35 self. history = [| 

36 self .G = NX. Graph() 

37 def parsePag(self ,urlend): 

38 urlatual = urlend 

39 user agent = ’Mozilla/4.0 ( 
compatible; MSIE 5.5; Windows NT 

40 values = {’name’ : "John Smith’, 

41 “location “Northampton”, 

42 language” : "Python" } 

43 headers = { ’User—Agent ’ 
user_agent } 

44 data = urllib.urlencode(values) 

45 print "Abrindo ", urlend 

46 req = urllib2.Request(urlend , data, 
headers) 

47 fd = urllib2.urlopen(req) 

48 html = fd.read() 

49 return html 

50 

51 def verResp (self , html): 

52 

53 Verifica se resposta e um hit ou nao 

54 

55 Inkart = SoupStrainer( a”, href=re. 
compile(’*/wiki/«’)) 

56 artlist = [tag|’href’] for tag in 











BS(html, parseOnlyThese=Inkart ) | 


8.3. 


57 


58 


59 
60 
61 
62 


63 


64 
65 
66 


67 
68 
69 
70 
71 
72 
73 
74 
75 
76 


77 
78 








79 
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if artlist [0].endswith(’Disambig.svg 


self. fila .append("http:// "+ 
langatual+”. wikipedia. org '+ 
artlist [3]) 

self. curlinks = artlist 

else: 

self. curlinks = artlist 

Ideia (nome=nomeatual ,nlinks = 
len(artlist), links = 
artlist ,ender = urlatual) 

self .G.add_edges_ from ([( 
nomeatual,i) for i in self. 
curlinks |) 

if self.curdepth > self.depth: 
return 

self. fila .extend (["http:// "+ 
langatual+' . wikipedia. org” + 
i for i in artlist]) 

self. curdepth +=1 


def move(self): 
if not self. fila: 
if not self.started: 
self. fila .append( self .SU) 
while self. fila: 
self.started = 1 
urlatual = self. fila .pop(0) 
nomeatual = urlatual. split ("/') 
[-1] 
if ":" in nomeatual: continue 
if nomeatual in [’Main_page’]+ 
self. history: continue 
print "buscando ", nomeatual , 
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80 print "Faltam ", len(self. fila) 

81 try: 

82 html = self .parsePag( 
urlatual ) 

83 except: 

84 continue 

85 self. verResp (html) 

86 self. nlinks +-1 

87 self. history . append (nomeatual) 


88 
89 
ə|| class UrlFac: 














91 def _ init (self, lang=’en’): 

92 global langatual 

93 self.lang = lang 

94 langatual = lang 

95 def urlifica (self ,palavra): 

96 nomeatual = palavra 

97 u = "http://"+self.lang+". wikipedia. 
org /wiki/"+palavra 

98 urlatual = u 

99 return u 

100 

101| if name =" main ": 

102 UF = UrlFac(’pt’) 

103 u = UF. urlifica(sys.argv[1]) 

104 Cr = Crawler(u,1) 

105 Cr.move() 








A listagem 8.5 mostra o restante do código da aranha e o lei- 
tor poderá explorar outras solução implementadas para otimizar 
o trabalho da aranha. Note que não estamos guardando o html 
completo das páginas para minimizar o espaço de armazenamento, 
mas este programa pode ser modificado facilmente de forma a reter 
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todo o conteúdo dos artigos. 


8.4 Exercícios 


1. Modifique a aranha apresentada neste capítulo, para guardar 
os documentos varridos. 


2. Crie uma classe capaz de conter os vários aspectos (links, 
figuras, etc) de um artigo da wikipedia, e utilize a aranha para 
criar instâncias desta classe para cada artigo encontrado, a 
partir de uma única palavra chave. Dica: para simplificar a 
persistência, armazene o objeto artigo como um Pickle, no 
banco de dados. 


Capitulo 9 


Simulações Estocasticas 


Seleção de problemas relacionados com a simulação e 
análise de processos estocásticos. Pré-requisitos: Co- 
nhecimentos avançados de estatística. 


Este capítulo, ilustraremos métodos computacionais voltados 
N para a geração e análise de processos estocásticos. 

Em probabilidade, um processo estocástico é uma função que 
produz resultados aleatórios. Se o domínio desta função for o 
tempo, o processo estocástico se manifestará como uma série tem- 
poral. Processos estocásticos espaciais, geram os chamados campos 
aleatórios 

Exemplos de processo estocáticos são séries temporais de preços 
de ações, flutuações de populações, distribuição espacial de polui- 
ção particulada. 

Muitos processos estocásticos naturais possuem estrutura em 
meio à aleatoriedade. Muitas das técnicas desenvolvidas para lidar 
com estes processos visam encontrar esta estrutura. 


9.1 Números Aleatórios 


Ao se estudar processos estocásticos por meio computacional, o 
primeiro problema que se precisa resolver é o da geração de núme- 
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ros aleatórios de forma confiável. Felizmente, hoje em dia, pacotes 
como o numpy ou o scipy, fornecem geradores de números aleató- 
rios de qualidade para muitas famílias de distribuições, de forma 
que na maioria das vezes não precisamos nos preocupar com este 
problema. Vez por outra, problemas de amostragem mais com- 
plexos podem exigir geradores mais sofisticados. Neste capítulo 
exploraremos algumas destas situações. 


Hipercubo Latino - LHS 


A técnica de amostragem do hipercubo latino, mais conhecida pelo 
seu nome original “Latin Hypercube Sampling” ou simplesmente 
LHS, é uma técnica de geração de amostras aleatórias a partir de 
uma distribuição conhecida. O diferencial deste algoritmo é que 
ele garante a amostragem de áreas de baixa probabilidade, mesmo 
em amostras de tamanho pequeno a moderado (Figura 9.1). 

A vantagem de se utilizar o LHS está na redução do custo com- 
putacional necessário para cobrir o espaço amostral, sem deixar 
brechas significativas. 

O algoritmo do LHS funciona particionando o suporte da va- 
riável em um número n de intervalos equiprováveis, onde n é o 
número de amostras que se deseja obter (Figura 9.2). Então re- 
tiramos uma amostra de cada intervalo (quantis) definido no eixo 
y da figura 9.2!. Isto é feito por amostragem uniforme naqueles 
intervalos (Linha 8 da listagem 9.1). Invertendo-se a função de 
densidade acumulada, obtemos as amostras de x correspondentes. 
Esta inversão é calculada por meio da função ppf (“percentile point 
function” que é o inverso da função de densidade acumulada (Li- 
nha 9 da listagem 9.1). As amostras assim geradas equivalem a 
amostras retiradas da distribuição de x, mas com uma cobertura 
homogênea do seu suporte. Na listagem 9.1, a amostragem por 
Hipercubo Latino é implementadada como uma função de apenas 





!Veja no programa lhsexp.py como o gráfico da figura 9.2 foi gerado 
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4.0 





















35+ 


3.0} 


2.5+ 








2.07 


1.54 


1.0- 


0.5; 








0.0, 


Figura 9.1: Amostragem (n=20) de uma distribuição normal com 
média 0 por LHS (histograma mais escuro) e amostragem padrão 
do scipy (histograma mais claro). 


três linhas, graças à utização dos geradores de números aleatórios 
disponíveis no módulo stats do scipy. Neste módulo os geradores 
são classes portadoras de métodos muito convenientes como o rvs 
que gera amostras aleatórias, e o ppf(ou percentile point function) 
que representa a inversa da função de densidade acumulada. Além 
dos métodos utilizados neste exemplo, existem muitos outros. O 
leitor é encorajado a explorar estas classes e seus métodos. 


Listagem 9.1: Amostragem por Hipercubo latino (LHS) 


#!/usr/bin/python 
# Disponivel no pacote de programas como: 





E 








2 
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1.0 





0.8 


0.6 


0.4 





Frequencia acumulada 


0.2 











0.0 





-0.842 -0.2530.253 0.842 
x 


Figura 9.2: Distribuição acumulada da variável « ~ N(0,1), mos- 
trando o particionamento do espaço amostral em segmentos equi- 
prováveis. 


lhs.py 

3|| from pylab import plot, figure, hist ,show, 
savefig 

import scipy.stats as stats 

import numpy 


def lhs(dist, parms, n= a 


O © ND na A 


perc = numpy.arange(0,1.,1./n) 
smp = |stats. T Ei /n).rvs() for i 
in perc | 











10 v = dist (parms[0],1./parms[1]) . ppf(smp) 
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11 return v 

12 

13|| if name ==" main : 

14 c=lhs (stats .norm, [0,1],20) 

15 hist(c) 

16 n = stats .norm.rvs(size=20) 

17 hist (n.ravel() ,facecolor=’r’,alpha =0.3) 
18 savefig (’lhs.png’ , dpi=400) 

19 show () 

















9.2 Inferéncia Bayesiana 


Atualmente, a resolução de problemas de inferência Bayesiana de 
considerável complexidade, tem se tornado cada vez mais acessível, 
graças à utilização de métodos computacionais. Isto não significa 
que a computação bayesiana seja simples; pelo contrário. Entre- 
tanto, as vantagens da inferência Bayesiana sobre a abordagem 
frequentista, justificam um certo esforço por parte do pesquisador 
no sentido de dominar estas técnicas. 

Antes de chegarmos às técnicas computacionais utilizadas para 
resolver os problemas da inferência Bayesiana, vamos nos deter 
um pouco sobre o porquê da intratabilidade analítica da inferência 
Bayesiana, aplicada a modelos complexos. 

Sejam dois eventos E e F. A probabilidade condicional de E 
dado F é dada por: 


P(ENF) 


PUE| F)= Som 


A partir desta fórmula, podemos obter a versão mais simples 
do teorema de Bayes. 


P(F | E)P(E) 


P(E | F)= aH 
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Se particionarmos o eventos E em n eventos, mutuamente ex- 
cludentes, pelo teorema da probabilidade total, chegaremos à ver- 
são mais comumente utilizada da fórmula de Bayes: 





_  P(F| E)P(Ei) 
P(E; | F) = Si P(F | Ei) P(E;) 


O teorema de Bayes nos permite calcular as probabilidades de um 
conjunto de hipóteses explanatórias (E;), dado que observamos cer- 
tos fatos (F): P(E; | F). Mas o teorema de Bayes também nos 
diz que estas probabilidades dependem das probabilidades a pri- 
ori das hipóteses P(E;) (antes da observação dos fatos). Dadas 
estas, o teorema de Bayes nos fornece uma excelente ferramenta, 
para atualização de nossos conhecimentos prévios, P(E;) à luz de 
novos fatos P(E; | F). 

A definição acima reflete uma situação em que temos um con- 
junto discreto de hipóteses explanatórias (E;), sobre as quais de- 
sejamos realizar nossa inferência. Quando nossas hipóteses são 
representadas, não por um conjunto enumerável de opções, mas 
pelo valor de uma ou mais variáveis contínuas, O, e os fatos ou da- 
dos denotados por X, nossos conhecimentos prévios passam a ser 
representados por distribuições de probabilidade p(0) e os dados, 
condicionados às hipóteses, f(x | 8), são representados pela função 
de verossimilhança L(0; x). 

Com a ajuda de alguma álgebra e do teorema da probabilidade 
total, em sua versão contínua, chegamos à forma contínua do teo- 
rema de Bayes: 


pO) E1052) 
Jg L(6; x)p(0)de 


Ao resolvermos a integral no denominador, este deixa de ser 
uma função de 6 e torna-se apenas uma constante de proporciona- 
lidade que garante que a integral de 7(@ | x) seja igual a 1. Isto 
nos permite re-escrever a equação acima como: 


T(0 | x) 
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(0 | x) x p(0)L(0; x) 


Logo, a densidade posterior de 0 é proporcional à sua densidade 
a priori multiplicada pela verossimilhança. 

Conforme vimos acima, a inferência Bayesiana pode ser bas- 
tante intuitiva, conceitualmente. Na prática, porém, quando que- 
remos calcular a distribuição posterior dos parâmetros, nos depa- 
ramos com vários problemas numéricos de considerável dificuldade. 

Para encontrar a constante de proporcionalidade mencionada 
na seção anterior, precisamos integrar o produto da distribuição 
a priori dos parâmetros pela verossimilhança, sobre o suporte de 
O. Se este suporte é infinito e/ou multidimensional, temos um 
problema de integração numérica complicadíssimo. 

Uma vez obtida a constante de proporcionalidade, se o espaço 
de parâmetros é multidimensional, encontrar as distribuições mar- 
ginais para cada um deles, também é um problema de integração 
numérica difícil. 


9.3 Simulaçoes Estocásticas 


Se não podemos determinar de forma exata, analítica ou numerica- 
mente, as distribuições posteriores geradas pelo teoremas de Bayes, 
só nos resta tentar simular amostras destas distribuições e estudá- 
las. Esta abordagem é denominada método de Monte Carlo, em 
homenagem ao famoso cassino de Mônaco. 


Integração Monte Carlo 


Suponhamos que precisemos resolver a seguinte integral?: 





2Para humanizar um pouco esta equação, imagine que f(y | x) representa 
a probabilidade condicional de y dado x, e que g(x) a função de densidade de 
probabilidade de x. 
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Ja) = [ Fw | a)g(e)de = Elfty |2)] < +00 


Se g(x) é uma densidade da qual podemos amostrar, podemos 
aproximar nossa integral da seguinte forma: 


n 


jy) == 5 fula) 


onde aj,...,2n ~ g(x). Pela lei dos grandes números, esta 
estimativa se aproximará assintoticamente de J(y). 

Vejamos um exemplo: gostarfamos de encontrar a integral da 
função y = « no intervalo [0,1]. Pela fórmula da área do triân- 
gulo, (base x altura)/2 o resultado exato é 0.5. Na listagem 9.2, 
nosso g(x) passa a ser uma distribuição uniforme entre 0 e 1, visto 
que este é o intervalo sobre qual desejamos integrar nossa função. 
Vemos que quanto maior o número de amostras de x, mais nossa 
estimativa se aproximará de 0.5 


Listagem 9.2: Integração Monte Carlo 





from numpy import x 

from numpy.random import x 

# desejamos área embaixo de uma reta 
# dada pela função y=x 

# ou seja: 0.5 

x = uniform(0,1,5000) 

# Seja f(y|x) = x 

J = 1./5000*sum (x) 

print J 


o o q Det FF Ww N e 
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9.4 Amostragem por Rejeição 


Suponhamos que se deseje obter amostras de uma função de den- 
sidade p(x), com suporte no intervalo [a,b], tal que p(x) < m, 
Va € [a,b]. Então definimos: 


X ~ U[a, db) 


Y ~ U[0,m) 


Geramos «x e y a partir destas distribuições e aceitamos x como 
um valor de p(x) se y < f(x), caso contrario, rejeitamos a amostra 
e tentamos novamente. Este procedimento significa que definimos 
uma função constante f(x) = m, que funciona como um “envelope” 
para o nosso processo de amostragem. 

Em suma, geramos um valor x a partir do suporte de X e 
aceitamos este valor com uma probabilidade f(x)/m, caso contrário 
rejeitamos e tentamos novamente. 

A eficiência deste método depende da proporção de pontos 
amostrados que são aceitos. A probabilidade de aceitação para 
este método é: 


P(aceitar) = P((X,Y) € A) 


dx 





i 1 
=} P((X,Y) € A| X =a) x; 


eae 
1 b 
USO f f(x) da 
1 


-~ m(b—a) 


I 
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Se a probabilidade de aceitação for muito baixa, devemos bus- 
car um outro método mais eficiente. Especialmente para distribui- 
ções com suporte infinito, a escolha de uma “função envelope” mais 
adequada, pode ajudar a aumentar a eficiência da amostragem. 


Método do Envelope 


Suponhamos que desejemos simular X com uma densidade de pro- 
babilidade (PDF) f(-) e que podemos obter amostras de Y (que 
possui o mesmo suporte de X), cuja PDF é g(:). Suponhamos 
ainda que exista uma constante a tal que: 


f(x) < ag(a), Va 


ou seja, a é um limite superior para f(x)/g(x). 

Então, amostramos Y = y de g(-), e U = u ~ U[0,ag(y)]. 
Aceitamos y como uma amostra de X se u < f(y)); caso contrá- 
rio, rejeitamos e tentamos novamente. Este método funciona pois 
distribui pontos uniformemente sobre a região que envolve f(x), e 
aceita apenas os pontos que cumprem o requisito de pertencer à 
região delimitada por f(z). 

Qual a probabilidade de aceitação? 


Co 


PU <f(¥)) = / PU < F(Y) | Y =y)aly) dy 


—00 


= = g(y) dy 


ag 
ap doy 





I 
| 
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Naturalmente, devemos escolher g(x) de forma que a seja o 
menor possível. 


Vamos ver como podemos representar estas idéias em Python. 


Listagem 9.3: Amostragem por rejeição utilizando o método do 
envelope 





ıl Æ Disponivel no pacote de programas como: 
envelope .py 


2| from numpy import x 

3| from numpy.random import x 

4| from pylab import x 

5 

s| def amostra (n): 

7 "uN 

8 Esta funcao amostra de x e retorna 

9 um vetor mais curto que n. 

10 meee 

11 x=uniform (0,1,n) 

12 y=uniform (0,1,n)*1.5 

13 fx=6xx*(1—x) # x tem distribuicao beta 

14 #retorna so os valores que satifazem a 
seguinte condicao: 

15 s=compress (y<fx ,x) 

16 return s 


17 


18| def eficiencia (vector ,n): 


19 wan 


20 Testa a eficiencia da amostragem. 

21 retorna a probabilidade de aceitacao. 
22 man 

23 l = len(vector) 

24 prob = l/float (n) 











25 diff = n-l 
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26 #n necessario para obter as amostras que 
faltam 

27 n2 = int (diff /prob) 

28 vec2 = amostra(n2) 

29 s = concatenate ((vector , vec2)) 

30 #gera histograma 

31 nb, bins, patches = hist(s, bins=50, 
normed=0) 

32 xlabel(’ Amostra’) 

33 ylabel(’ Probabilidade”) 

34 title (’Histograma de s: n=%s’% n) 

35 savefig(’envelope.png’, dpi=400) 

36 show () 

37 return s 


38 


39|| def testRS(): 


40 nua 














41 Esta funcao testa o modulo 
42 man 

43 n=100000 

44 sample=amostra(n) 

45 eficiencia (sample ,n) 

46 

arll if name =— ’” main ? 

48 testRS () 








Aplicando ao Teorema de Bayes 


Podemos aplicar o conceito de amostragem por rejeição a proble- 
mas de inferência Bayesiana. Frequentemente, em inferência Baye- 
siana, conhecemos bem a distribuição a priori, a ponto de poder 
amostrá-la e, também, possuimos dados com os quais podemos 
construir a função de verossimilhança. 
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Histograma de s: n=100000 
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Figura 9.3: Resultado da amostragem por envelope de uma distri- 
buição beta(1,1) 


De posse destes elementos podemos invocar a técnica de amos- 
tragem por rejeição para nos ajudar a amostrar da distribuição 
posterior. Dado que: 


T(0) = p(0)L(0; x) 


temos que, sendo Lmaz O valor máximo da nossa função de 


verossimilhança, 
m(0) < p(0)Lmas 


m(0)  _ pO)L(0;x) _ L(0;x) 





LmazplO) Lmaxp(0) Lmas 
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Assim sendo, podemos utilizar o método do envelope, amos- 
trando da distribuição a priori e aceitando as amostras com pro- 
babilidade igual a pm, 














# Disponivel no pacote de programas como: 


postrej.py 


from numpy import x 
from numpy.random import x 
from pylab import x 


def 


def 


Likeli (data, limits, nl): 

n = len(data) # Numero de amostras 
data — array (data) 

(11 jul) = limits #limites do espaco de 


params. 
step = (ul-11)/float (nl) 
res = [|] #lista de resultados 


sd = std(data) #DP dos dados 
for mu in arange(ll ,ul,step): 
res. append (exp(—0.5*sum (((data—mu) / 
sd) **2))) 
lik = array(res)/max(array(res)) # 
Verossimilhanca 
return lik 


amostra(n, data, plotted=0): 
x=uniform(0,1,n) #suporte 

limits = 0,1 

L=Likeli(data, limits, n) 
fx=6*x*x(1—x) # priori ,beta(2,2) 
s=compress(L[:len(x)|<fx,x) #Rejeicao 
if not plotted: 
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25 pl = scatter (x, fx) 
26 p2 = plot (sort (x) ,L) 
27 legend ([p1,p2],[ Priori’, ? 


Verossimilhanca ’]) 
28 return s 

29 
so|| def eficiencia(vector ,n, data): 


31 l = len(vector) 

32 prob = l/float (n) 

33 diff = n-l 

34 n2 = int(diff/prob) 

35 vec2 = amostra (n2, data, plotted=1) 
36 s = concatenate (( vector , vec2)) 

37 return s,prob 


38 
39|| def main(): 


40 n=90000 

41 data = uniform (0,1,3) 

42 sample=amostra(n, data) 

43 s,prob = eficiencia (sample,n, data) 

44 figure (2) gera histograma 

45 hist(s, bins=50,normed=1) 

46 xlabel(’x’) 

47 text (0.8,1.2,’Eficiencia:%s ’%round (prob 
2)) 

48 ylabel(’frequencia’) 

49 title(’Posterior: n=%s’% n) 

50 savefig (’rejeicao.png’ ,dpi=400) 

51 show () 

52 return s 

53 

54) if name =’ main  ’ 











55 main () 
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Figura 9.4: Amostragem por rejeição da posterior Bayesiana. 


Na linha 22 da listagem 9.4, vemos a rejeição de acordo com a 
verossimilhança. Note que a verossimilhança é calculada a partir de 
um modelo normal enquanto que a distribuição a priori apresenta 
uma distribuição beta(2,2). 

A figura 9.4 mostra o resultado da amostragem da posterior, 
junto com a eficiência do processo(canto superior direito). 


9.5 Cadeias de Markov 


Cadeias de Markov são um tipo particular de processo estocástico 
no qual o estado atual do sistema depende apenas do estado imedi- 
atamente anterior. Um exemplo muito conhecido de um processo 
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de markov é o modelo auto-regressivo de primeira ordem: 
— 2 
Zi = QZt—1 FEt, a~ N(0, o ) 


O processo apresentado acima, à medida em que o número de 
iterações cresce, converge para uma distribuição 7(z). Esta distri- 
buição é denominada distribuição estacionária da cadeia. Entre- 
tanto, a cadeia necessita de um determinado número de iterações 
para alcançar 7(z). Se desejamos fazer inferências sobre m(z), pre- 
cisamos descartar os resultados iniciais da cadeia. Este período 
necessário para a convergência, é denominado de “burn-in”. 


Listagem 9.5: Cadeia de Markov com kernel de transição exponen- 
cial 





1||#-*—coding : latin —1-+— 

24% Disponivel no pacote de programas como: 
markov. py 

#gerando uma cadeia de markov 

from numpy.random import x 

import random as rn 

from pylab import x 


n=10000 

alpha=0.99 

10//x=zeros(10000, Float) 

ul for i in xrange(1,n): 

12| x[il=-alpha+x[i—1|] + exponential (1,1) [0] 
13| Æ plotting 

14|| subplot (211) 

is title (’ Processo de Markov’) 


O o q De À Ww 


16|| plot (x) 
ir] xlabel(u"Iterações ”) 
is}, ylabel ("x") 











19|| subplot (212) 
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20|| hist (x, bins=50) 

2i|| xlabel(’x’) 

22|| ylabel(u’ frequência’) 

23|| savefig (’markov. png’ ,dpi=400) 
24|| show () 








Executando o código apresentado na listagem 9.5 obtém-se a 
figura 9.5. Note o período até a convergência. Como exercício, 
refaça o histograma eliminando os valores do período “burn-in”, e 
compare com o apresentado na figura 9.5. 
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Figura 9.5: Cadeia de Markov com kernel de transição exponencial. 
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9.6 MCMC (Markov Chain Monte Carlo) 


Nós já discutimos algumas ferramentas básicas da simulação esto- 
cástica, como o método de Monte Carlo e as cadeias de Markov. 
Agora vamos ver como estes dois métodos podem ser combinados 
para dar origem ao famoso método MCMC. 

As técnicas aqui apresentadas, são de grande utilidade na esta- 
tística, particularmente na inferência Bayesiana. 

O MCMC é uma classe de algoritmos que tem como objetivo 
contruir cadeias de Markov cuja distribuição estacionária seja idên- 
tica a de uma distribuição alvo. Após alcançarem esta distribuição 
estacionária, as cadeias podem ser usadas para se obter amostras 
da distribuição alvo. 

As cadeias de Markov utilizadas na maioria dos algoritmos 
de MCMC, percorrem o espaço amostral utilizando-se de alguma 
forma de passeio aleatório. Portanto, podem levar muito tempo 
para cobrir o espaço desejado. Isto se deve ao fato de que a cadeia 
pode voltar atrás percorrendo partes do espaço já percorridas. A 
seguir descreveremos e implementaremos dois dos mais utilizados 
métodos de MCMC: os amostradores de Metropolis-Hastings e de 
Gibbs. 


O Amostrador de Metropolis-Hastings 


Este amostrador consiste em gerar amostras sequenciais de forma a 
aproximar uma distribuição da qual não temos meios de amostrar 
diretamente. Este algoritmo pode amostrar de qualquer distribui- 
ção de probabilidade p(x), desde que a densidade em x possa ser 
calculada. 

Como qualquer cadeia de markov, o amostrador começa em um 
dado valor arbitrário para a variável x e prossegue em um passeio 
aleatório, onde cada deslocamento é amostrado de uma distribuição 
de “Propostas”. Cada proposta(x”) é avaliada de acordo com a se- 
guinte regra: u é amostrado de uma distribuição uniforme, U(0,1). 


218 CAPITULO 9. SIMULACOES ESTOCASTICAS 


Se 


t 


på 


o o | QO a À O 


10 
11 


12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 


/ 
p(z’) 
p(xt) 
se torna %441, caso contrário zty = Tt. 





Listagem 9.6: Amostrador de Metropolis-Hastings 











#—-*— encoding: latin —l—*— 

# Disponivel no pacote de programas como: MH 
«py 

from numpy import x 

from scipy.stats import * 


class Amostrador: 
def _ init (self, alvo, proposta): 
man 
Incializa o amostrador 
alvo: dados definindo densidade alvo 
proposta: objeto gerador de 
propostas. 
man 
self.alvo = kde. gaussian_kde(alvo) 
self.prop = proposta 


def Run(self ,n, burnin=100): 


q 3/3 


Roda o amostrador por n passos 
amostra = zeros(n, float ) 
alvo = self.alvo 
i=0 
while i < n-1: 
x = amostra [i] 
inova = self.prop.rvs() [0] 
can = x + inova 
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27 aprob = min([1,alvo.evaluate(can 
)/alvo . evaluate (x) ]) 

28 u = uniform.rvs() [0] 

29 if u < aprob: 

30 amostra[i+1] = x = can 

31 i++ 1 

32 return amostra [burnin :] 

33 

34| if name ==" main ": 

35 import pylab as P 

36 dados = concatenate ((norm.rvs(size=500), 
norm.rvs(4,1,size=500))) 

37 a = Amostrador (dados ,norm(0,1)) 

38 res — a.Run(10000) 

39 P. plot (arange(—5,10,.01) ,a. alvo .evaluate 
(arange(—5,10,.01)),’r’ ,lw=2) 

40 P. hist (res ,normed=1,alpha=0.5) 

41 P. legend (|° Alvo’ ,’Amostra’ ]) 

42 P.savefig ( MH. png’ ,dpi=400) 

43 P.show() 








Normalmente, utiliza-se um amostrador como este para amos- 
trar de distribuições das quais toda a informação que se tem pro- 
vém de uma amostra. Portanto, a Listagem 9.6, aceita um con- 
junto de dados como alvo. A partir desta amostra, uma função 
de densidade de probabilidade (PDF) é estimada por meio da fun- 
ção gaussian kde do Scipy. Esta função será utilizada como alvo 
para o amostrador. 

Note que a distribuição de propostas passada para o objeto 
Amostrador é uma das classes geradoras de números aleatórios 
oferecidos por scipy.stats?. A Figura 9.6, mostra o resultado 





“Estas classes podem ser chamadas diretamente com seus parâmetros como 
mostrado na linha 36 da listagem 9.6, retornando um objeto “frozen” com os 
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do amostrador após a remoção de um número de amostras do iní- 
cio da cadeia determinado pelo parâmetro burnin. Esta remoção 
é importante, pois a cadeia leva algum tempo para convergir para 
a área sob a curva alvo. 





Em Amostra | | 





0.14+ 


0.12} 


0.10f 


0.08} 


0.06} 








Figura 9.6: Amostrador de Metropolis-Hastings(n=10000). 


O Amostrador de Gibbs 


O amostrador de Gibbs foi desenvolvido para permitir a geração de 
amostras a partir de distribuições conjuntas de duas ou mais va- 
riáveis. O amostrador de Gibbs é um caso especial do amostrador 
de Metropolis-Hastings. Na listagem 9.7, vemos uma implementa- 





mesmos métodos mas com os parâmetros fixos 
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ção do amostrador de Gibbs, que envolve a definição de uma classe 
amostradora. 


Listagem 9.7: Amostrador de Gibbs aplicado à uma distribuição 
tri-variada 





1/44 Disponivel no pacote de programas como: 
gibbs.py 

2| #—*—encoding : latin —1—*— 

3| from numpy import zeros, sqrt, array 

4| from numpy.random import x 

5 

6| class Amostra: 

7 def __init (self, n,varlist ,loc,scale, 

cormat, burnin=1000): 

8 

9 n é o tamanho da amostra 

10 varlist é a lista de funções 
geradoras do numpy 

11 loc e scale sao listas para cada 
gerador em varlist 

12 geradores testados: 

13 normal, beta, gamma, gumbel 

14 logistic , lognormal, wald, laplace 

15 oe 

16 self.n=n 

17 self.vars = varlist 

18 self.loc = loc 

19 self.scale = scale 

20 self.ro = cormat 

21 self. burnin = burnin 

22 def Run(self): 

23 results = zeros ((len (self. vars), self 
.n),float) 

24 dp = sqgrt(l—- self .rox*2) 
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25 ms = self.loc 

26 dps = self.scale 

27 ro = self.ro 

28 for i in xrange(1,self.n): 

29 for n,j in enumerate(self.vars): 
30 results[n,i] = j(ms[n]+ro[n, 


n—1]*(results [n—1,i—1]- 
ms[n]) /dps[n—1],dps[n]* 











dp[n,n—1]) 

31 return results [:,self.burnin:] 

32 

as|| if name =" man ": 

34 import pylab as P 

35 n = 10000 

36 varlist = (beta ,gamma, normal) 

a7 loc = (2.,9.,5,) 

38 scale = (2,.5,1.) 

39 cormat = zeros((3,3),float) 

40 #cormat = array 
([[1,0.6,0.7],[0.6,1,0.8],[0.7,0.8,1]] 

41 s = Amostra(n, varlist ,loc , scale ,cormat) 

42 res = s.Run() 

43 sl=P.plot(res[0],res[2],’.’)#marker=’p’, 
c=’y’,mec=’k’ ,lw=0) 

44 s2-P. plot (res [|1] ,res [2], ’+’)#marker=’v’, 
c=’y’,mec=’k’ ,lw=0) 

45 P.legend([’Beta x Normal’, Gamma x 
Normal’ ]) 

46 P. savefig(’ gibbs. png’ ,dpi=400) 

47 P.show () 











O amostrador de Gibbs pode ser aplicado quando não se co- 
nhece a distribuição conjunta, mas a distribuição condicional de 


SS 
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cada variável é conhecida. No amostrador de Gibbs convencional, 
cada nova amostra x},, é calculada de forma condicional ao valor 
de todas outras variáveis no tempo t. No exemplo mostrado na lis- 
tagem 9.7, uma variante deste método é implementado, na qual as 
variáveis são calculadas a partir de uma estrutura de dependência 
circular(Figura 9.7). 


De® 


Figura 9.7: Estrutura de dependência circular utilizada na listagem 
9.7. 


9.7 Métodos Monte Carlo Sequenciais 


Estes métodos, também chamados de filtros de partículas, visam 
determinar a distribuição de um processo markoviano pela análise 
sequencial de observações. Seja zy uma sequência de parâmetros 
desconhecidos (por exemplo o valor esperado de um sistema dinâ- 
mico) onde k = 0,1,2,3,... e yk E [yo,y1,-..,Yk] O conjunto de 
observações sobre X (Figura 9.9). 

Os métodos sequenciais procuram estimar x, a partir da distri- 
buição posterior 


plz | Yo; Y1,- --;Yk) 


ao passo que os métodos MCMC, modelam a posterior com- 
pleta: 


p(z +0, 2£1,...,£k | os Y1,- --; Yk) 
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Figura 9.8: Amostrador de Gibbs aplicado a uma distribuição tri- 
variada. 


Sampling Importance Resampling — SIR 


O algoritmo de amostragem e re-amostragem por importância é um 
dos métodos Monte Carlo sequenciais mais utilizados. Ele procura 
aproximar p(xy | yo,y1,...,Yk) por meio de valores de x pondera- 
dos por uma função de importância,W que é uma aproximação da 
distribuição posterior de X 

A descrição de um passo do SIR, é a seguinte: 


1. Retiramos P amostras (%) da distribuição a priori de transi- 
ção de X, p(£k | 2-1); 
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Figura 9.9: Processo markoviano e suas observações. 


2. Calculamos a p(y | £k) (verossimilhança, no caso da distri- 
buição alvo ser a posterior Bayesiana); 


3. Calculamos W = p(ax | ve-)p(yk | £k); 
4, Normalizamos W; 


5. Re-amostramos P valores de ĉ com probabilidades dadas por 
W; 


A re-amostra (distribuição posterior de x,)passa a ser a a priori 
de transição para a o próximo passo. 


Listagem 9.8: Filtro de partículas usando algoritmo SIR 





1||##-*-encoding: latin —1—*— 
24% Disponivel no pacote de programas como: 
sir . py 


22 
23 
24 
25 
26 
27 
28 
29 
30 
31 








32 
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from numpy import x 
import like 

import pylab as P 

from scipy.stats import * 


class SMC: 


nua 


Monte Carlo Sequencial usando SIR 
mma 
def _ init (self, priortype,pars, range 
, resolution =512): 
Inicializa Filtro. 
priortype deve ser um RNG de scipy. 
stats 
pars são os parâmetros da priori. 


Fra 


self. priori = priortype 
self.pars = pars 
self.range = range 


self.res = (range[1]—range[0]) *1./ 
resolution 

self.likelihood = None 

self. posterior=array ([]) 


def | call (self ,datum) : 
sc = self. pars [1] 
m = self .range [0] 
M = self.range[1] 
step = self. res 
sup = arange(m,M, step) 
lik = exp(array ([like . Normal (datum , i 
,sc) for i in sup|)) 
self.likelihood = lik /sum(lik ) 
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33 post = self. calcPosterior (1000) 

34 return post 

35 

36 def calcPosterior (self, n): 

37 meen 

38 Calcula a distribuição posterior 

39 meen 

40 if self.posterior .any(): 

41 s = self. priori.rvs(size-n, loc= 
self.pars [0], scale=self. 
pars[1]) 

42 #pdens= kde. gaussian kde( self. 
posterior) 

43 #s= pdens.resample(n) 

44 else: 

45 s = self. priori.rvs(size-=n, 


loc=self.pars[0], scale= 
self.pars[1]) 


46 m = array (| self.range [0]]) 

47 M = array ([ self .range[1]]) 

48 step = self.res 

49 supp = arange (m,M, step) 

50 s = compress (less (s.ravel() M) & 
greater(s.ravel() ;m),s) 

51 d = uniform.rvs(loc=0,scale=1,size=s 
. size) 

52 if self.posterior .any(): 

53 w= self.priori.pdf(supp)»*self. 

likelihood 
54 else: 
55 w= self. priori.pdf(supp,loc= 


self.pars [0], scale=self.pars 
[1])*self.likelihood 
56 w = w/sum(w) 
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57 sx — searchsorted (supp,s) 

58 w = w|sx—1] 

59 w = w.ravel() 

60 post = compress (d<w,s) 

61 post = post.ravel() 

62 self.posterior = post 

63 return post 

64 

es|| if name =" man ": 

66 pf = SMC(norm,(3 ,3) ,range=(—10,15)) 

67 data = 2xsin (arange (0,7 ,.2))+2#o0ones (10) 

68 sup = arange(—10,15,25/512.) 

69 priori = norm. pdf(sup ,loc=3,scale=1) 

70 P.ion () 

71 lin, = P. plot (sup, priori) 

72 pt, =P.plot ([data[0]] ,[0.05],’o’) 

73 P. grid() 

74 for i in data: 

75 est = pf([i]) 

76 lin.set ydata(kde.gaussian kde(est). 
evaluate (sup)) 

77 pt.set_xdata([i]) 

78 P. draw () 

79 print i,compress(pf.likelihood—max( 
pf.likelihood), sup) ,median(est ) 

















Na Listagem 9.8, vemos uma implementação de um filtro de 
partículas utilizando o algoritmo SIR. O filtro é definido como uma 
classe. Nesta classe definimos o método __call__, característico 
de funções. Desta forma, uma vez criado o objeto (instância da 
classe SMC), ele poderá ser chamado diretamente pelo nome. Se o 
objeto não possuísse tal método, teríamos que nos utilizar de um 
de seus métodos para acionar sua “maquinaria”. 

Parametrizamos o objeto SMC com uma distribuição a priori 
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dada pela classe norm do módulo scipy.stats com média u = 3 e 
desvio padrão o = 3. Também precisamos especificar os limites de 
busca do algoritmo, o que é feito através do argumento range pas- 
sado durante a inicialização. Neste exemplo as funções de cálculo 
das verossimilhanças foram implementadas de um módulo sepa- 
rado chamado like.py. Este módulo está no pacote de programas 
disponível no website deste livro. 

A convergência dos métodos sequenciais, depende fortemente 
da qualidade do algoritmo de amostragem da priori, uma vez que 
estas amostras formam a “matéria-prima” do algoritmo SIR. 


9.8 Funções de Verossimilhança 


Ser capaz de calcular funções de verossimilhança é essencial quando 
se deseja utilizar a inferência Bayesiana. A verossimilhança é o 
termo da fórmula de Bayes que representa a evidência contida em 
um conjunto de dados, e que é utilizada para atualizar nosso co- 
nhecimento a priori do problema, de forma a gerar uma nova des- 
crição para suas variávieis, denominada de distribuição posterior 
conjunta. 


Definição da função de verossimilhança 
Variável Discreta 


Seja O um espaço de parâmetros. Seja {pọ;0 E O) uma famila pa- 
rametrizada de modelos probabilísticos para um vetor de variáveis 
discretas X = (X1,...,X,). A função de verossimilhança para 
(x1,..., Un) é dada por: 


L(0 | £1,..., £n) 2 polxi,..., Zn) 


e é uma função de 6. 
A função de verossimilhança nos dá a probabilidade de que 
(X1,...,Xn) = (11,...,%n), ou seja um determinado conjunto de 
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dados será amostrado em uma realização do processo gerador, para 
cada valor possível de 6. Matematicamente, a função de verossimi- 
lhança é apenas uma notação diferente para a função de probabili- 
dade. Contudo, conceitualmente existe uma distinção importante: 
Quando se estuda a função de probabilidade, fixa-se o parâmetro e 
obtêm-se a variação da probabilidade em função do valor da variá- 
vel, x. Quando estudamos a verossimilhança, consideramos o valor 
de x fixo e variamos o parâmetro, obtendo a verossimilhança de 
cada valor. Para uma única observação de uma variável discreta, 
a verossimilhança é igual à probabilidade de se observar aquele 
valor. Por exemplo: Seja P, uma distribuição Bernoulli com para- 
metro p,0 < p < 1. Uma variável aleatória com uma distribuição 
Bernoulli, só pode assumir dois valores, 0 e 1. 
Para x = 0, 
L(p|0)=1—p 
Para xz = 1, 
L@|1) =p 
Um pouco de álgebra, nos permite combinar ambas as fórmulas 
acima escrevendo: 


L(p|z)=p"(1—p)**, xe {0,1} 
Podemos visualizar a forma da verossimilhança com quatro li- 
nhas de código: 
Listagem 9.9: Função de verossimilhança para x igual a 0. 


>>> from pylab import x 

>>> L=[1-p for p in arange(0,1,.01)] 
>>> plot(arange(0,1,.01),L) 

>>> show () 


e Ù N e 


Para múltiplas observações independentes, a função de verossi- 
milhança ficaria assim: 


Lp tis) = pap)!" )]p" N- 0)" *2] cs. pa 
pri ti (1 — p) PTX mi 


— p) 


Ssa) 


(9.1) 
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Isto dito, vamos a um exemplo cientifico mais concreto: um 
pesquisador deseja comparar duas sequéncias de DNA, buscando 
quantificar a homologia entre elas, ou seja, em quantas posições 
possuem nucleotideos idénticos. Sejam as duas sequéncias: 


ATT AGCCCTTGGGAACATCCC 
ATGAGCTCTTGGTTAAGACCC 


Assumindo independéncia entre os loci, podemos representar 
esta comparação como uma variável Bernoulli (X;)que assume valor 
1 para loci com letras iguais e 0 para loci com letras distintas. 
Vamos resolver este problema aplicando a equação 9.1. 


Listagem 9.10: Calculando a verossimilhança da comparação de 
duas sequências de DNA 





1| #—*— coding : latin —1l—+— 

24% Disponivel no pacote de programas como: 
likl .py 

from pylab import x 

a ="ATTAGOOCTIGGGAACATOCO! 

b ="ATGAGCICTIGGTTAAGACCC" 

n = len(a) 

# Comparando as sequéncias: 

comp = [int(a[il-=b[i]) for i in range(len(a 


ony Dm ow À O 


94% Contando número de correspondências 

10] soma = sum(array (comp) ) 

u|/# Calculando L 

12| L = [p+r*rsoma*(l-p)++*(n-soma) for p in arange 
(0,1,.01)] 

13|| plot (arange (0,1,.01), L) 

14| savefig (’lik1.png’ ,dpi=400) 

15|| Show () 
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A figura 9.10 mostra a função de verossimilhança gerada pela 
listagem 9.10. Mais adiante usaremos este resultado em outro 
exemplo. 

Analisando o código da listagem 9.10, utilizamos a técnica de 
list comprehension para comparar as duas sequências locus a locus 
retornando 1 quando fossem iguais e 0, caso contrário. Como a 
comparação retorna verdadeiro (True) ou falso (False), aplicamos 
a função int para transformar estas saídas em 1 e 0, respectiva- 
mente. Na linha 9, convertemos a lista de resultados da comparação 
em vetor para poder somar os seus elementos com sum. Na linha 
11, usamos técnica similar à da linha 7 para calcular a função de 
verossimilhança. 


0.0000016 





0.0000014}+ 


0.0000012} 


0.0000010}+ 


0.0000008; 


0.0000006; 


0.0000004; 


0.0000002}+ 








0.0000000 





Figura 9.10: Função de verossimilhança para a comparação de 
sequências de DNA. 
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Variável Contínua 


A função de verossimilhança para variáveis aleatórias contínuas é 
similar ao caso discreto apresentado acima. Para uma variável con- 
tínua, substituímos a função de probabilidade da definição discreta 
pela função de densidade de probabilidade. Se go(x1,...,%n),0 E€ 
O, representa uma família de funções de densidade de probabili- 
dade conjuntas para (X1,..., Xn), então 


n 
L(6 | 21,...,2n) = [| fol 
i=1 

se X1,..., Xn forem independentes e identicamente distribuí- 
das. 

A título de exemplo, vamos escrever a função de verossimilhança 
para uma variável aleatória normal X com média p e variância 1. 
Neste caso, u é o nosso parâmetro 0. Dado que a densidade de X; 
é (27) 12e-(-1º/2 para n=3 temos 


L(u | z1, 22,03) = (27)? e221 m, (9.2) 


Como podemos ver pelas equações 9.2 e 9.1, a verossimilhança é 
uma família de funções que difere por um fator que não depende 
de 8. Portanto, apenas seu valor relativo (forma) nos interessa. 


Log-verossimilhança 


Na função de verossimilhança, o termo que não depende de 0, de- 
pende de n (o tamanho amostral), com isso o valor da verossimi- 
lhança facilmente torna-se extremo*. Devido a esta característica 
da função de verossimilhança, frequentemente utiliza-se o seu loga- 
ritmo. Vamos plotar a log-verossimilhança calculada na listagem” 
9.10. 





“Se isto não é óbvio para você, utilize seus conhecimentos de Python para 
investigar numericamente este fato. 
5Modifique a listagem anterior incluindo estas linhas 
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Listagem 9.11: Log-verossimilhanca 





på 


L[O]=L[1] #removendo o zero do início da 
lista 

plot (arange(0,1,.01) , log(array(L))) 

show () 


N 








w 








Compare agora os dois gráficos(?? e 9.11). Preste atenção aos va- 
lores do eixo y. A função mudou de forma, porém preservou uma 
coisa muito importante: o seu máximo continua com a mesma abs- 
cissa. Isto nos leva a uma aplicação muito importante da função 
verossimilhança: a estimação de parâmetros por máxima verossi- 
milhança. 


-20 
-30 
-40 
-50 


-60 


“Bo 0.2 0.4 0.6 0.8 1.0 


Figura 9.11: Log-verossimilhança da função descrita anteriormente. 
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Vimos na listagem 9.10 que, quando calculamos a função de 
verossimilhança sobre dados obtidos experimentalmente, ela repre- 
senta a “probabilidade” de cada valor de parâmetro no eixo x ter 
gerado aquele conjunto de dados. Logo, se desejamos estimar este 
parâmetro a partir dos dados, devemos escolher o valor que maxi- 
miza a função de verossimilhança. Felizmente, este valor é o mesmo 
para a log-verossimilhança. 

Voltando ao problema da comparação de duas sequências de 
DNA, vamos maximizar a função de verossimilhança para estimar 
p (ver listagem 9.12). 


Listagem 9.12: Maximizando a verossimilhança 





1| MLE = compress(equal (L,max(L)) ,arange 
(0,1,.01)) 

print MLE 

[ 0.67] 


N 


w 














Na linha 1 da listagem 9.12, utiliza-se uma função proveniente 
do módulo numpy*. Esta função (compress) nos retorna os elemen- 
tos do segundo argumento arange(0,1,.01), nas posições em que 
o vetor de condições, equal (L ,max(L)), for verdadeiro. Trocando 
em miúdos: nos retorna o valor do parâmetro p para o qual o valor 
da verossimilhança é máximo. As funções max e equal também são 
provenientes do módulo numpy. 


9.9 Inferéncia Bayesiana com Objetos. 


Na visão Bayesiana de mundo, nosso conhecimento sobre o mundo 
é representado por nossas crenças que, por sua vez, são representa- 
das por variáveis aleatórias com suas distribuições de probabilidade 
(PDFs). Como nosso conhecimento do mundo não é perfeito, es- 
tas distribuições não têm precisão infinita, ou seja, não podem ser 





êImportado, neste exemplo, pelo módulo pylab. 
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representadas por um simples número. Por exemplo, minha altura 
não é 1,73m mas uma distribuição de valores em torno deste, visto 
que depende de vários fatores tais como postura, quantidade de 
cabelo, etc. 

Naturalmente, nossas crenças podem ser modificadas. A cada 
vez que nós nos expomos a novas evidências(dados) a respeito de 
um fato, podemos reforçar nossa crença original (aumentando sua 
precisão). Ou podemos ficar mais confusos, se os dados não con- 
cordam com nossa crença original, e esta última perderá precisão. 

O objetivo desta seção, é construir um objeto que emule as ca- 
racterísticas de variável aleatória Bayesiana, facilitando-nos a rea- 
lização das operações mencionadas acima. 

Em computação se desejarmos representar uma distribuição 
p(x), teremos que fazê-lo por meio de uma função (se esta fun- 
ção for conhecida e computável) que recebe x como argumento e 
na sua probabilidade, ou por alguma outra estrutura de dados que 
combine todos valores de x e suas respectivas probabilidades, como 
por exemplo um dicionário. Naturalmente esta última representa- 
ção se presta apenas a uma gama bastante limitada de variáveis. 


1 >>> # Distribuição de probabilidades de um 
dado cúbico 

2 >>> dado = 
{1:1/6. ,2:1/6. ,3:1/6. ,4:1/6. ,5:1/6. ,6:1/6.} 


Listagem 9.13: Classe Variável Aleatória Bayesiana — Requisitos. 


al copyright 2007 Flavio Codeco Coelho 
alt Licensed under GPL v3 
5 
6 





from numpy import x 
import like, sys 














Como toda variável Bayesiana, nossa classe deve possuir uma 
distribuição a priori, neste exemplo definida de forma paramétrica. 
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Deve também conter dados referentes a ela, e uma distribuição 
posterior. Naturalmente deve possuir os métodos para atualizar a 
sua distribuição a priori, transformando-a em posterior. 


Listagem 9.14: Classe Variável Aleatória Bayesiana — Inicialização. 











s| from scipy.stats import x 

9 

10|| class BayesVar: 

11 meen 

12 Bayesian random variate. 

13 "uN 

14 def __init_ (self, priortype,pars, range 

,resolution=512): 

15 ep 

16 Inicializa variável aleatória. 

17 Adquire métodos da classe priortype 

18 priortype deve ser um RNG de scipy. 
stats 

19 pars são os parâmetros da priori. 

20 E Ma 

21 self.priorn = priortype .name 

22 self. flavorize(priortype(*pars) , 
priortype) 

23 self.pars = pars 

24 self.range = range 

25 self.res = (range[1]—range[0]) *1./ 
resolution 

26 self. likefun = self. _Likelihood (self 
.priorn) 

27 self. likelihood = None 











Esta classe deve solicitar estas informações na sua inicializa- 
ção(Listagem 9.14). O pacote scipy.stats já possui classes cor- 
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respondendo a varias familias paramétricas. Portanto nossa classe 
requer que o argumento priortype seja uma destas classes. Re- 
quer também os parâmetros da a priori, a extensão do suporte para 
a variável,e a resolução da representação das distribuições(número 
de pontos em se subdividirá o suporte). 

Durante a inicialização da classe, importamos os métodos da 
distribuição a priori para se juntar aos métodos de nossa classe. 
Esta absorção de funcionalidade não poderia ser conseguida através 
de herança comum, pois não se sabe de antemão de qual classe 
desejamos herdá-los. Felizmente, a natureza dinâmica do Python 
nos ajudou neste ponto, permitindo uma herança dinâmica. Esta 
“herança” é feita no método _flavorize (Listagem 9.15). 


Listagem 9.15: Classe Variável Aleatória Bayesiana — Herança di- 
nâmica de métodos. 





29 self. posterior-=array ([]) 

30 

31 def flavorize(self,pt, ptbase): 

32 

33 add methods from distribution type 

34 EE 

35 self.cdf = pt.cdf 

36 self.isf = pt.isf 

37 if isinstance (ptbase,rv continuous): 

38 self.pdf = pt.pdf 

39 elif isinstance(ptbase ,rv_ discrete): 

40 self.pdf = pt.pmf 

41 else: sys.exit(’Invalid distribution 
object ’) 

















De acordo com o tipo de distribuição a priori, o método Like- 
lihood escolhe e retorna a função de verossimilhança adequada(Listagem 
9.16). 
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Listagem 9.16: Classe Variável Aleatória Bayesiana — Herança di- 
nâmica de métodos. 





100 return || 

101 

102 def  Likelihood (self ,typ): 

103 wr? 

104 Define familia paramétrica da 

verossimilhança. 

105 Retorna função de verossimilhança. 

106 typ deve ser uma string. 

107 ip 

108 if typ — ’norm’: 

109 return lambda(x): like . Normal (x 
[0] ,x[1] ,1./x[2]) 

110 elif typ = ’expon’: 

111 return lambda(x):(1./x[2]) **x 
[0]. sizexexp(—(1./x[2]) «sum( 
x[0])) 

















Durante a inicialização da variável, uma lista vazia de dados 
é criada. Esta lista conterá todos os conjuntos de dados indepen- 
dentes que forem atribuídos à variável. Isto é importante pois a 
teoria Bayesiana opera por atualizações sucessivas da distribuição 
posterior a cada novo conjunto de evidências. Uma vez gerada, a 
distribuição posterior fica guardada no atributo posterior. 

Nossa classe possui ainda um método chamado addData, cuja 
função é a de armazenar os dados, e recalcular a função de veros- 
similhança chamando o método _update(Listagem 9.17). 


Listagem 9.17: Classe Variável Aleatória Bayesiana — Adição de 
dados e cálculo da Verossimilhança. 





42 self.ppf = pt.ppf 
43 self.rvs = pt.rvs 
44 def update(self): 
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45 "uN 

46 Calculate likelihood function 

47 "uN 

48 if self.data: 

49 d = self.data|—1] 

50 sc = self.pars[1] 

51 m = self. range [0] 

52 M = self.range [1] 

53 step = self. res 

54 #self.likefun returns log— 
likelihood 

55 lik = exp(array ([ self. likefun ((d 
,i,sc)) for i in arange(m,M, 
step) ])) 

56 self. likelihood = lik /sum(lik ) 

57 

58 def addData(self , data = []): 

59 meen 

60 Adds dataset to variable’s data 

store 
61 ween 











Os métodos getPriorSample e getPriorDist retornam amos- 
tras e a PDF da distribuição a priori, respectivamente(Listagem 
9.18). 


Listagem 9.18: Classe Variável Aleatória Bayesiana — Amostras e 
PDF da a priori. 











63 self. update () 

64 

65 def getPriorSample(self ,n): 

66 iad 

67 Returns a sample from the prior 
distribution 
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68 
69 
70 
71 
72 
73 








+ > 9 


return self.rvs(size=n) 


def getPriorDist (self): 


wie 


Returns the prior PDF. 
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Por fim temos o método mais complexo: getPosteriorSample 


(Listagem 9.19). Este método é responsável por atualizar a distri- 
buição posterior da variável sempre que se solicitar uma amostra. 
Utiliza um método de amostragem por importância no qual se rea- 
mostra a distribuição a priori com um probabilidade proporcional 
ao produto da verossimilhança e da distribuição a priori. Vale no- 
tar, que se existir alguma posterior já calculada, esta é utilizada 
como a priori. Como deve ser. 


Listagem 9.19: Classe Variável Aleatória Bayesiana — Gerando a 





posterior. 

74 meee 

75 return self.pdf(arange(self.range 
[0], self.range[1],self.res)) 

76 def getPosteriorSample(self, n): 


77 
78 


79 
80 


81 


82 
83 
84 
85 








nua 


Return a sample of the posterior 
distribution. 
meen 
if self.posterior .any():# Use last 
posterior as prior 
k= kde. gausian_kde(self. 
posterior) 
s= k.resample(n) 
else: 
s = self. getPriorSample(n) 
if self. data: 
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86 m = self.range [0] 

87 M = self.range [1] 

88 step = self.res 

89 supp = arange (m,M, step )#support 

90 s = compress(less(s.ravel() M) & 
greater(s.ravel() ,m) ,s)# 
removing out—of—range 
samples 

91 d = uniform.rvs(loc=0,scale=1, 
size=len(s))#Uniform 0-1 
samples 

92 w = self. pdf(supp)+*self. 
likelihood 

93 w = w/sum(w) #normalizing 
weights 

94 sx = searchsorted (supp,s) 

95 w = w[sx—1]#search sorted 
returns 1l—based binlist 

96 post = compress (d<w,s) 

97 self.posterior = post 

98 return post 

















O código completo deste programa(Listagem 9.21) inclui, ainda, 
algumas linhas para testar a classe (Listagem 9.20). Este teste 
consiste em inicializar a variável com uma distribuição a priori 
Normal com média u = 3 e desvio padrão o = 1. Um pequeno 
conjunto de observações, escolhido de forma a não concordar com 
a distribuição a priori, é utilizado para demonstrar a atualização 
da variável(Figura 9.12). 


Listagem 9.20: Classe Variável Aleatória Bayesiana — Código de 
teste. 





113 return lambda(x): like .Beta(x 


[0] ,.x[1] ,x[2]) 
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us| if name ==" main ": 

116 bv = BayesVar(norm,(3,1) ,range=(0,5) ) 
117 data = ones (20) 

118 bv .addData( data) 

119 p = bv. getPosteriorSample (200000) 


122 P.hist(p, normed=1) 
128 P.legend ([ Likelihood’, ’Prior ’]) 








P. plot (arange(bv. range [0] ,bv.range[1], 
by.res),bv. likelihood , ’ro’, lw=2) 

P. plot (arange(bv. range [0] ,bv.range[1], 
bv.res) ,bv.getPriorDist () ,’g+’ ,lw=2) 
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Bayesian inference 
2.5 r - 


e e Likelihood 
+ + Prior 





Figura 9.12: Resultado da listagem 9.21. 
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Listagem 9.21: Classe Variável Aleatória Bayesiana — Listagem 


completa, 


o © | ow ÀA U 


10 
11 
12 
13 
14 


15 
16 
17 


18 


19 
20 
21 
22 


23 
24 
25 











#—-*— encoding: latin —1—*— 

# Disponivel no pacote de programas como: 
Bayes. py 

# copyright 2007 Flavio Codeco Coelho 

# Licensed under GPL v3 

from numpy import x 

import like, sys 

import pylab as P 

from scipy.stats import * 


class BayesVar: 
mma 


Bayesian random variate. 

meen 

def __init_ (self, priortype,pars, range 
,resolution=512): 
Inicializa variável aleatória. 
Adquire métodos da classe priortype 


priortype deve ser um RNG de scipy. 
stats 

pars são os parâmetros da priori. 

self.priorn = priortype.name 

self. flavorize(priortype(*pars) , 
priortype) 

self.pars = pars 

self.range = range 

self.res = (range[1]—range[0]) *1./ 
resolution 
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26 self.likefun = self. Likelihood (self 
.priorn) 

27 self. likelihood = None 

28 self.data = [] 

29 self. posterior=array ([]) 

30 

31 def _flavorize(self ,pt, ptbase): 

32 

33 add methods from distribution type 

34 

35 self.cdf = pt.cdf 

36 self.isf = pt.isf 

37 if isinstance (ptbase,rv continuous): 

38 self.pdf = pt.pdf 

39 elif isinstance (ptbase,rv discrete): 

40 self.pdf = pt.pmf 

41 else: sys.exit(’Invalid distribution 
object ’) 

42 self.ppf = pt.ppf 

43 self.rvs = pt.rvs 

44 def _update(self): 

45 "uN 

46 Calculate likelihood function 

47 "uN 

48 if self.data: 

49 d = self.data|—1] 

50 sc = self.pars[1] 

51 m = self.range[0] 

52 M = self.range [1] 

53 step = self.res 

54 #self.likefun returns log— 

likelihood 
55 lik = exp(array ([ self. likefun ((d 
,i,sc)) for i in arange(m,M, 
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step) ])) 
56 self.likelihood = lik /sum(lik ) 
57 
58 def addData(self , data = []): 
59 meen 
60 Adds dataset to variable’s data 
store 
61 meee 
62 self.data.append(array (data) ) 
63 self. update () 
64 
65 def getPriorSample (self ,n): 
66 2909 
67 Returns a sample from the prior 
distribution 
68 2909 
69 return self.rvs(size=n) 
70 
71 def getPriorDist(self): 
72 meee 
73 Returns the prior PDF. 
74 mma 
75 return self.pdf(arange(self.range 
[0], self.range[1],self.res)) 
76 def getPosteriorSample(self, n): 
77 meee 
78 Return a sample of the posterior 
distribution. 
79 meee 
80 if self.posterior.any():# Use last 
posterior as prior 
81 k= kde.gausian kde(self. 
posterior) 
82 s= k.resample(n) 
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83 
84 
85 
86 
87 
88 
89 


90 


91 


92 


93 


94 


95 








def 


else: 
s = self. getPriorSample(n) 
if self. data: 
m= self. range [0] 
M = self. range [1] 
step = self. res 
supp = arange(m,M, step )#support 


s = compress(less(s.ravel() ,M) & 


greater(s.ravel() .m),s)# 
removing out—of—range 
samples 

d = uniform.rvs(loc=0,scale=1, 
size=len(s))#Uniform 0-1 


samples 

w = self.pdf(supp)xself. 
likelihood 

w = w/sum(w) #normalizing 
weights 

sx = searchsorted (supp,s) 


w = w[sx—l]#search sorted 
returns l—based binlist 


post = compress(d<w,s) 
self.posterior = post 
return post 

else: 


return |] 


_ Likelihood (self ,typ): 

Define familia paramétrica da 
verossimilhança. 

Retorna função de verossimilhança. 

typ deve ser uma string. 


299 
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108 if typ == ’norm’: 

109 return lambda(x): like .Normal(x 
[0] ,x[1] ,1./[2]) 

110 elif typ == ’expon’: 

111 return lambda(x):(1./x[2]) **x 
[0]. size xexp(—(1./x[2]) *sum( 
x[0]) ) 

112 elif typ = "beta: 

113 return lambda(x): like . Beta(x 

[0] ,x[1],x[2]) 

114 

115|| if name =" main ": 

116 bv = BayesVar(norm,(3,1),range=(0,5)) 

117 data = ones (20) 

118 bv.addData(data) 

119 p = bv. getPosteriorSample (200000) 

120 P. plot (arange(bv.range[0],bv.range[1], 

by.res),bv.likelihood , ’ro’, lw=2) 
121 P. plot (arange(bv.range[0],bv.range[1], 
bv.res) ,bv.getPriorDist () ,’g+’ ,lw=2) 

122 P.hist(p, normed=1) 

123 P.legend ([ Likelihood’ ,’ Prior’ ]) 

124 P.title(’ Bayesian inference’) 

125 P. savefig (’ bayesvar.png’ ,dpi=400) 

126 P. show () 

















9.10 Exercicios 


1. Compare a acurácia do amostrador de Metropolis-Hastings 
com o amostrador oferecido pelo método resample do objeto 
retornado por gaussian kde. Teste com diferentes formas de 
distribuição. O método resample é uma mera amostragem 
com reposição. 
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2. Verifique a importância do tamanho amostral na atualização 
da distribuição posterior de uma variável, utilizando o pro- 
grama da listagem 9.21 


3. Experimente diferentes valores para a variância da distribui- 
ção a priori do exemplo 9.8, e verifique o efeito na conver- 
gência do algoritmo. 


4. Utilize o método do hipercubo latino ilustrado na listagem 9.1 
para gerar amostras das distribuições a priori nos exemplos 
9.8 e 9.21 e avalie o seu impacto na qualidade das estimativas. 


Apéndices 
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Introducao ao Console 
Gnu /Linux 


Guia de sobrevivência no console do Gnu/Linux 


console Gnu/Linux é um poderoso ambiente de trabalho, em 
O contraste com a interface limitada, oferecida pelo sistema ope- 
racional DOS, ao qual é comumente comparado. O console Gnu/- 
Linux tem uma longa história desde sua origem no “Bourne shelP, 
distribuido com o Sistema operacional(SO) UNIX versão 7. Em 
sua evolução, deu origem a algumas variantes. A variante mais 
amplamente utilizada e que será objeto de utilização e análise neste 
capítulo é o Bash ou “Bourne Again Shell”. Ao longo deste capi- 
tulo o termo console e shell serão utilizados com o mesmo sentido, 
ainda que, tecnicamente não sejam sinônimos. Isto se deve à falta 
de uma tradução mais adequada para a palavra inglesa “shell”. 

Qual a relevância de um tutorial sobre shell em um livro sobre 
computação científica? Qualquer cientista com alguma experiên- 
cia em computação está plenamente consciente do fato de que a 
maior parte do seu trabalho, se dá através da combinação da fun- 
cionalidade de diversos aplicativos científicos para a realização de 
tarefas científicas de maior complexidade. Neste caso, o ambiente 
de trabalho é chave para agilizar esta articulação entre aplicati- 
vos. Este capítulo se propõe a demonstrar, através de exemplos, 
que o GNU/Linux é um ambiente muito superior para este tipo 
de atividade, se comparado com Sistemas Operacionais voltados 
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principalmente para usuários leigos. 

Além do Console e sua linguagem (bash), neste capítulo va- 
mos conhecer diversos aplicativos disponíveis no sistema operacio- 
nal Gnu/Linux, desenvolvidos para serem utilizados no console. 


A linguagem BASH 


A primeira coisa que se deve entender antes de começar a estudar 
o shell do Linux, é que este é uma linguagem de programação bas- 
tante poderosa em si mesmo. O termo Shell, cápsula, traduzido 
literalmente, se refere à sua função como uma interface entre o 
usuário e o sistema operacional. À shell nos oferece uma interface 
textual para invocarmos aplicativos e lidarmos com suas entradas 
e saídas. À segunda coisa que se deve entender é que a shell não é o 
sistema operacional, mas um aplicativo que nos facilita a interação 
com o SO. 

O Shell não depende de interfaces gráficas sofisticadas, mas co- 
mumente é utilizado através de uma janela, do conforto de uma 
interface gráfica. Na figura 1, vemos um exemplo de uma sessão 
do bash rodando em uma janela. 


Alguns Comando Úteis 


Is Lista arquivos. pwd Imprime o nome do di- 
retório corrente (caminho 
cp Copia arquivos. completo). 


mv Renomeia ou move arqui- mkdir Cria um diretório. 


as rmdir Remove um diretório. 
rm Apaga arquivos (de ver- Para remover recursiva- 
dade!). mente toda uma árvore 
de diretórios use rm - 
In Cria links para arquivos. rf(cuidado!). 
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Sessão Editar Ver 


Favoritos Configurações Ajuda 











fecoelho@sombra ~/Documents/LivroPython/code $ ls 








appletp.py for.py listc.py MH. py~ subplot.py 

dataaug.py gibbs.py markov.py out.png  subplot.py~ 

demo. pov likl.py  mathtext.py out.pov weavefib.py 

filledspiral.py likl.py- MH.py povpy.py 

fecoelho@sombra ~/Documents/LivroPython/code $ ls -l 

total 264 

-rw-r--r-- l fccoelho users 146 2005-07-29 16:41 appletp.py 

-rw-r--r-- 1 fccoelho users 266 2006-09-14 13:33 dataaug.py 

-rw-r--r-- 1 fecoelho users 233 2006-09-28 17:52 demo.pov 

-rw-r--r-- 1 fccoelho users 419 2006-09-14 13:34 filledspiral.py 

-rw-r--r-- 1 fecoelho users 48 2006-09-04 16:06 for.py 

-rw-r--r-- 1 fecoelho users 493 2006-09-14 16:27 gibbs.py 

-rw-r--r-- 1 fecoelho users 347 2006-09-14 17:29 likl.py 

-rw-r--r-- 1 fecoelho users 347 2006-09-14 16:44 likl.py~ 

-rw-r--r-- 1 fecoelho users 32 2006-09-04 16:06 listc.py 

-rw-r--r-- 1 fecoelho users 395 2006-09-14 16:20 markov.py 

-rw-r--r-- 1 fccoelho users 311 2006-09-14 16:11 mathtext.py 

-rw-r--r-- 1 fecoelho users 607 2006-09-14 17:28 MH.py 

-rw-r--r-- 1 fecoelho users 607 2006-09-14 16:38 MH.py- LJ 

-rw-r--r-- 1 fccoelho users 145986 2006-09-28 18:01 out.png EE 

-rw-r--r-- 1 fecoelho users 45262 2006-09-28 17:52 out.pov E 
- 

(Z) | = Shell AR 


Figura 1: Konsole: janela contendo uma sessão bash (ou outra) no 


KDE. 


cat Joga o arquivo inteiro na 
tela. 


less Visualiza o arquivo com 
possibilidade de movimen- 
tação e busca dentro do 
mesmo. 


head Visualiza o início do ar- 
quivo. 


tail Visualiza o final do ar- 
quivo. 


nl Visualiza com numeração 
das linhas. 


od Visualiza arquivo binário 
em base octal. 


xxd Visualiza arquivo binário 
em base hexadecimal. 
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gv Visualiza arquivos Posts- 


cript/PDF. 


xdvi Visualiza arquivos DVI 


gerados pelo TRX. 


stat Mostra atributos dos ar- 
quivos. 


we Conta 
nhas. 


bytes/palavras /li- 


du Uso de espaço em disco. 
file Identifica tipo do arquivo. 


touch Atualiza registro de úl- 
tima atualização do ar- 
quivo. Caso o arquivo não 
exista, é criado. 


chown Altera o dono do ar- 
quivo. 


chgrp Altera o grupo do ar- 
quivo. 


chmod Altera as permissões de 
um arquivo. 


chattr Altera atributos avan- 
cados de um arquivo. 


Isattr Lista atributos avança- 
dos do arquivo. 


find Localiza arquivos. 


256 


locate Localiza arquivo por 
meio de índice criado com 
updatedb. 


which Localiza comandos. 


whereis Localiza o binário 
(executável), fontes, e pá- 
gina man de um comando. 


grep Busca em texto retor- 
nando linhas. 


cut Extrai colunas de um ar- 
quivo. 


paste Anexa colunas de um ar- 
quivo texto. 


sort Ordena linhas. 
uniq Localiza linhas idênticas. 


gzip Compacta arquivos no for- 
mato GNU Zip. 


compress Compacta arquivos. 


bzip2 Compacta arqui- 
vos(maior compactação do 
que o gzip, porém mais 
lento. 


zip Compacta arquivos no for- 
mato zip(Windows). 


diff Compara arquivos linha a 
linha. 


Entradas e Saídas, redirecionamento e "Pipes". 





comm Compara arquivos orde- 
nados. 


uptime Retorna tempo desde o 
último boot, e carga do 


; sistema. 
cmp Compara arquivos byte 
por byte. top Monitora processos em exe- 


md5sum Calcula checksums. usa 


df Espaço livre em todos os dis- free Mostra memória livre. 


cos(pendrives e etc.) mon- kill Mata processos. 
tados. 
nice Ajusta a prioridade de um 


mount Torna um disco acessi- processo. 


vel. 
renice Altera a prioridade de 


fsck Verifica um disco procu- 
um processo. 


rando por erros. 
; ; watch Executa programas a in- 
sync Esvazia caches de disco. prog 

tervalos regulares. 


s Lista todos os processos. 
p É crontab Agenda tarefas perió- 


w Lista os processos do usuário. dicas. 


Entradas e Saídas, redirecionamento e "Pipes". 


O esquema padrão de entradas e saídas dos SOs derivados do 
UNIX, está baseado em duas idéias muito simples: toda comunica- 
çao é formada por uma sequência arbitrária de caracteres (Bytes), 
e qualquer elemento do SO que produza ou aceite dados é tratado 
como um arquivo, desde dispositivos de hardware até programas. 
Por convenção um programa UNIX apresenta três canais de 
comunicação com o mundo externo: entrada padrão ou STDIN, 
saída padrao ou STDOUT e saída de erros padrão ou STDERR. 
O Bash(assim como praticamente todas as outras shells) torna 
muito simples a utilização destes canais padrão. Normalmente, um 
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usuario utiliza estes canais com a finalidade de redirecionar dados 
através de uma sequéncia de passos de processamento. Como este 
processo se assemelha ao modo como canalizamos agua para levá-la 
de um ponto ao outro, Estas construções receberam o apelido de 
“pipelines"ou tubulações onde cada segmento é chamado de “pipe". 

Devido a essa facilidade, muitos dos utilitários disponíveis na 
shell do Gnu/Linux foram desenvolvidos para fazer uma única coisa 
bem, uma vez que funções mais complexas poderiam ser obtidas 
combinando programas através de “pipelines". 


Redirecionamento 


Para redirecionar algum dado para o STDIN de um programa, utili- 
zamos o caracter <. Por exemplo, suponha que temos um arquivo 
chamado nomes contendo uma lista de nomes, um por linha. O 
comando sort < nomes irá lançar na tela os nomes ordenados al- 
fabeticamente. De maneira similar, podemos utilizar o caracter > 
para redirecionar a saida de um programa para um arquivo, por 
exemplo. 


Listagem 22: Redirecionando STDIN e STDOUT 


1 $ sort < nomes > nomes ordenados 


O comando do exemplo 22, cria um novo arquivo com o con- 
teúdo do arquivo nomes, ordenado. 


“Pipelines” 


Podemos também redirecionar saídas de comandos para outros co- 
mandos, ao invés de arquivos, como vimos anteriormente. O carac- 
tere que usamos para isto é o | conhecido como “pipe”. Qualquer 
linha de comando conectando dois ou mais comandos através de 


A 


“pipes” é denominada de “pipeline”. 
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Listagem 23: Lista ordenada dos usuarios do sistema. 


1 $ cut —d: —f1 < /etc/passwd | sort 
ajaxterm 

avahi 

avahi—autoipd 

backup 

beagleindex 

bin 

boinc 


e WwW N 


o © N Q A 


O simples exemplo apresentado dá uma idéia do poder dos “pipe- 
lines’, além da sua conveniência para realizar tarefas complexas, 
sem a necessidade de armazenar dados intermediários em arquivos, 
antes de redirecioná-los a outros programas. 


Pérolas Científicas do Console Gnu/Linux 


O console Gnu/Linux extrai a maior parte da sua extrema versati- 
lidade de uma extensa coleção de aplicativos leves desenvolvidos” 
para serem utilizados diretamente do console. Nesta seção, vamos 
ver alguns exemplos, uma vez que seria impossível explorar todos 
eles, neste simples apêndice. 


Gnu plotutils 


O “GNu Ploting Utilities’ é uma suite de aplicativos gráficos e 
matemáticos desenvolvidos para o console Gnu/Linux. São eles: 


graph Lê um ou mais conjuntos de dados a partir de arquivos ou 
de STDIN e prepara um gráfico; 





"Desenvolvidos principalmente pelo projeto Gnu 
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plot Converte Gnu metafile para qualquer dos formatos listados 
acima; 


pic2plot Converte diagramas criados na linguagem pic para qual- 
quer dos formatos acima; 


tek2plot Converte do formato Tektronix para qualquer dos for- 
matos acima. 


Estes aplicativos gráficos podem criar e exportar gráficos bi- 
dimensionais em treze formatos diferentes: SVG, PNG, PNM, pseudo-GIF, 
WebCGM, Illustrator, Postscript, PCL 5, HP-GL/2, Fig (editável 
com o editor de desenhos xfig), ReGIS, Tektronix ou GNU Metafile. 


Aplicativos Matemáticos: 


ode Integra numericamente sistemas de equações diferenciais or- 
dinárias (EDO); 


spline Interpola curvas utilizando “splines” cúbicas ou exponenci- 
ais. Pode ser utilizado como filtro em tempo real. 


graph 


A cada vez que chamamos o programa graph, ele lê um ou mais 
conjuntos de dados a partir de arquivos especificados na linha de 
comando, ou diretamente da STDIN, e produz um gráfico. O gráfico 
pode ser mostrado em uma janela, ou salvo em um arquivo em 
qualquer dos formatos suportados. 


Listagem 24: Plotando dados em um arquivo. 
1 $ graph —T png < arquivo de dados ascii > 
plot . png 


Se o arquivo_de_dados_ascii contiver duas colunas de núme- 
ros, o programa as atribuirá a x e y, respectivamente. Os pares 


260 


Pérolas Cientificas do Console Gnu/Linux 





ordenados que darão origem aos pontos do gráfico não precisam 
estar em linhas diferentes. por exemplo: 


Listagem 25: Desenhando um quadrado. 


1 $ echo .1 .1 .1 .9 .9 .9 .9 .1 .1 .1 | graph 
T X -C -m 1 -q 0.3 





A listagem 25 plotará um quadrado com vértices em (0.1,0.1), 
(0.1,0.9), (0.9,0.9) e (0.9,0.1). A repetição do primeiro vér- 
tice garante que o polígono será fechado. A opção -m indica o tipo 
da linha utilizada: 1-linha sólida, 2-pontilhada, 3-ponto e traço, 
4-traços curtos e 5-traços longos. A opção -q indica que o qua- 
drado será preenchido (densidade 30%) com a mesma cor da linha: 
vermelho (-C indica gráfico colorido). 

O programa graph aceita ainda muitas outras opções. Leia o 
manual(man graph) para descobrí-las. 


spline 


O programa funciona de forma similar ao graph no que diz res- 
peito à entradas e saídas. Como todos os aplicativos de console, 
beneficia-se muito da interação com outros programas via “pipes”. 


Listagem 26: Uso do spline 
1 $ echo 0 0112 0 | spline | graph -T X 


Spline não serve apenas para interpolar funções, também pode 
ser usado para interpolar curvas em um espaco d-dimensional utilizando- 
se a opçao -d. 


Listagem 27: Interpolando uma curva em um plano. 


1 echo 00101101 | spline -d 2 —a -s | 
graph -T X 


O comando da listagem 27 traçará uma curva passando pelos 
pontos (0,0), (1,0), (1,1) e (0,1). A opção -d 2 indica que 
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Xplot (= lolx) 
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Figura 2: Usando spline. 





Pérolas Cientificas do Console Gnu/Linux 





XDIoL [=Jojx) 





00 02 04 06 08 1.0 








Figura 3: Interpolando uma curva em um plano. 


a variável dependente é bi-dimensional. A opção -a indica que a 
variável independente deve ser gerada automáticamente e depois 
removida da saída (opção -s). 
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ode 


O utilitário ode é capaz de produzir uma solução numérica de sis- 
temas de equações diferenciais ordinárias. A saída de ode pode 
ser redirecionada para o utilitário graph, que já discutimos anteri- 
ormente, de forma que as soluções sejam plotadas diretamente, à 
medida em que são calculadas. 

Vejamos um exemplo simples: 


S = (o) (3) 


A solução desta equação é: 


y(t) =e! (4) 


Se nós resolvermos esta equação numericamente, a partir do 
valor inicial y(0) = 1, até t = 1 esperaríamos obter o valor de e 
como último valor da nossa curva (e! = 2.718282, com 7 algarismos 
significativos). Para isso digitamos no console: 


Listagem 28: Resolvendo uma equação diferencial simples no con- 
sole do Linux. 


1 $ ode 

2 Y'=y 

3 y=1 

4 print t,y 
5 step 0,1 


Após digitar a ultima linha do exemplo 28, duas colunas de 
números aparecerão: a primeira correspondendo ao valor de t e 
a segunda ao valor de y; a ultima linha será 1 2.718282. Como 
esperávamos. 

Para facilitar a re-utilização dos modelos, podemos colocar os 
comandos do exemplo 28 em um arquivo texto. Abra o seu editor 
favorito, e digite o seguinte modelo: 
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10 


Listagem 29: Sistema de três equações diferenciais acopladas 





# O modelo de Lorenz , Um sistema de três 
EDOs acopladas, 

# com um parâmetro r. 

x’? = —3x«(x-y) 

y’ = —x*z+r*x—y 

Zz’? = xX*y-Z 

r 26 

x 0; y= 1; z2=0 

print x, y 

step 0, 200 

















Salve o arquivo com o nome lorenz. Agora digite no console a 


seguinte linha de comandos: 


1 





$ ode < lorenz | graph -T X -C -x —10 10 —y 
—20 20 


E eis que surgirá a bela curva da figura 4. 
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xplot <3> (=[olx) 











Figura 4: Atrator de Lorenz. 
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